Gene Pars_1220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1220
Symbol
ID	5055027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	1105255
End bp	1106598
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	60%
IMG OID	640468767
Product	cobyrinic acid a,c-diamide synthase
Protein accession	YP_001153440
Protein GI	145591438
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1797] Cobyrinic acid a,c-diamide synthase
TIGRFAM ID	[TIGR00379] cobyrinic acid a,c-diamide synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.446908
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCCCC GTATAGTCAT ATCGGCCTTC AAAGGTATGT CAGGCAAGAC TCTTATTTCC 
TTGGCAGTAA TGAGGGGACT TAGGAGGAGG GGACTTAGGG TGGCGCCGTT TAAAATAGGC 
CCAGACTACA TAGACCCATC GTACCACCGC TGGGCCTCCC AAGTCCCCAG CCGGAACCTA 
GACGTGGTAT TGATGGGCGA GGAGGGCGTC CTCCGCAGGT TCCTCCGCTA CTCAGCGGGG 
GCTGACGTGG CCGTGGTGGA GGGGGTGCTG GGGCTCTACG ACTCAGTAGA CGGCGTCTCG 
GAGCTCGGCT CCACCGCGCA GGTGGCAAAG CTGCTCAAGG CCCCCGTCGT GTTGGTCCTC 
AACGCCGATA GGATAAACCG CACTTTAAGA GCTGTGGTAA GGGGGCTGAA GGCCTTCGAC 
CCCGCTGTGA AAATACCGGG CGTCATCTTC ACCAACGTCA CTCCAAGACA AGCCGAGAAG 
CTGGTAAAGG CCCTTCCCGA GGAGGGAGTA GAGGTGCTGG GCGTTGTGCC CAAGAGCAGA 
GCTGTGGCTG AGGCCTTTTC CTACCGCCAC CTGGGCCTAG TCCCCATGGC GGAGCGGAGC 
GACGCGCCGA CGCTGGAGGA GGTGCTGGAC AACTACGTCG AGCCTTACAT CGATCTGGAG 
AGGCTCGTGG AGATCGCGAA GTCCGCCGAG GAGCTAGGAG CCGCGGATTT ACCCAACGAT 
CCGCCTCCTC GCCTAGGTTG CAGAGTGGGG GTGGTGATGG ATGGGGCTTT CAACTTCTAC 
TACCCCGAGT TGCTGGAGGA GGCTGAGGCT CTCGGCGAAG TGGTCTACAC AAGCGCTGTG 
AGGGACAGCG CCGTTCCGGA TGTAGACGTG TTGATCATAG GTGGCGGGTT CCCAGAGTTG 
CTCGCGGAGA GGCTTGAGCG CAATAAGGCG TTTAGGAAGT CTCTTCTCTC GTATATCGAG 
AGGGGCGGCA GGCTGTACGC CGAATGCGGC GGCCTCATGT ACTTGACTTC GTCTATTGTC 
ATAGACCGCT CTGAGTACGA AATGGTGGGC GCCATAGACG GCGTGACCTA CATGCTGGAA 
AAGCCGGTGG GCAAGGGGTA CGTCTGGGGG GAGGTGGTGG GGGAAACCCC CATAGCGCCC 
CCCGGCACTA GGCTGAAGGG CCACGAGTTC CACTACAGTA AAATAGCGTT GAGGGAGAAG 
GTGAGGTTAG CGATAAGGCT CGAGAGGGGC GTCGGCGTGG TGGGCGGGTG GGACGGCGTG 
GTGAAAGGCA ACATGCACGC CCAGTACATG CACATACACC CCCAAACCTA CAGCGTAATT 
AGGCAACTAT GCCGATCTAC GTAG

Protein sequence

MVPRIVISAF KGMSGKTLIS LAVMRGLRRR GLRVAPFKIG PDYIDPSYHR WASQVPSRNL 
DVVLMGEEGV LRRFLRYSAG ADVAVVEGVL GLYDSVDGVS ELGSTAQVAK LLKAPVVLVL 
NADRINRTLR AVVRGLKAFD PAVKIPGVIF TNVTPRQAEK LVKALPEEGV EVLGVVPKSR 
AVAEAFSYRH LGLVPMAERS DAPTLEEVLD NYVEPYIDLE RLVEIAKSAE ELGAADLPND 
PPPRLGCRVG VVMDGAFNFY YPELLEEAEA LGEVVYTSAV RDSAVPDVDV LIIGGGFPEL 
LAERLERNKA FRKSLLSYIE RGGRLYAECG GLMYLTSSIV IDRSEYEMVG AIDGVTYMLE 
KPVGKGYVWG EVVGETPIAP PGTRLKGHEF HYSKIALREK VRLAIRLERG VGVVGGWDGV 
VKGNMHAQYM HIHPQTYSVI RQLCRST