Gene Acry_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1968
Symbol
ID	5161089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	2157764
End bp	2160076
Gene Length	2313 bp
Protein Length	770 aa
Translation table	11
GC content	70%
IMG OID	640553889
Product	carbon-monoxide dehydrogenase (acceptor)
Protein accession	YP_001235088
Protein GI	148260961
COG category	[C] Energy production and conversion
COG ID	[COG1529] Aerobic-type carbon monoxide dehydrogenase, large subunit CoxL/CutL homologs
TIGRFAM ID	[TIGR02416] carbon-monoxide dehydrogenase, large subunit

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.82678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGAAAT TCGGTCTTGC CCAGCCGGTC AAGCGCGTCG AGGATTCGCG GCTGCTGCGC 
GGCGCTGGAC AATATACCGA CGACGTTCCG GGCGAGGGCG CGCTGCACCT GCACGTCCTG 
CGTTCGCCGC ACGCCGCCGC GACGATCACC GGGATCGACG CCGAGGCCGC CCGCGCGGTG 
CCGGGCGTCG TCGCCATCGT CACCGGCGCG GATCTCGCCG CCGAGGGCAT CGCGCCGATT 
CCCTGCATGG TGCCGATCAA GAACCAGGAC GGCACGCCGC GCGCCCAGGC CGATCGCCCG 
GCCCTCGCCC AGGGCGCGGT GCGCCATGTC GGCGAGCCGG TGGCCTATAT CGTCGCCGAA 
ACCGCGCAGG CCGCGCGCGA TGCCGCCGAG CTGGTCGATG TCCGCTACGA CACGAAGCCC 
TCGATCACCG ATCTGGCCAG CGCGATGTCC GACAGCGCGC CGCGCGTGCA TGAGGACGCG 
CCGGCCAACC GCGTCTTCGA CTGGGCGGTG GGCGACGCCG CGAAGGTGGA CGAGCTGTTC 
GCCGCCGCCG CGCATGTGAC GAAGCTGCGC ATCGTCAACA ACCGCATCGT CGTCAACTCG 
CTGGAGCCCC GCGCCGCCCG CGCCGAGTTC GACGCGGCGT CCGGCCGCTG GACGCTGACC 
ACCAACACCC AGGGCGGCTG GCTGCTGAAG GACTGCCTCG CCGGCGCCGT GTTCAAGGTG 
GAGCCGGCGA AGTTCCGGGT CATCACCCCG GATGTCGGCG GCGGCTTCGG CATGAAGCTG 
TTCGTCTATC CCGAGCATGT CATGGTCTGC CACGCCGCCC GCAAGCTGGG CCGGCCGGTG 
AAATGGACCT CCGAGCGCAG CGAGGCGTTC CTCTCCGACA CGCATGGGCG CGACCACATC 
ACCATCGGCG AACTGGCGCT CGACGCCGAT CACCGGATCA CCGCCATGCG GGTGACGGAC 
ACGGCGAACA TGGGCGCCTA TCTCTCGAAT TTCGGCCCCT TCATCCCGAC CCTCGCCGGC 
ACCAAGGTGC TGGCCAGCGT CTATGGCATG AAGGCGATCC ATGCGCGGGT GTTCGGCGTG 
TTCACCAACA CCGTGCCGGT CGACGCCTAT CGCGGCGCCG GCCGCCCGGA GAGCAACTAT 
CTCGTCGAGC GGCTGATCGA CGCCGCCGCC CGCGAACTCG GGATCGACCG CGCCGAGCTG 
CGCCGCATCA ACATGGTGCC GGCGAGCGCC ATGCCCTTCA CCACCGCGAT GGCGCAGACC 
TACGATTCGG GCGATTTCCA CAAGGTGCTC GACCATGCGC TCGACATGAT CGACTGGAAG 
GGCTTCCCCG CCCGCCGCGC GAAGTCGGCT GCCGCCGGCA AGCGGCGCGG CATCGGCATG 
GCCTATTACC TCGAGGCGAC CGGCGGCGCG CCGGAGGAGC GCGCCGAGAT CCGCTTCACC 
AGGGATGGGC ATGTCGATGT CTATGTCGGC ACCCAGTCCA CCGGCCAGGG CCATGAAACC 
GCCTATGTGC AGCTGGTGAA CGACCGGCTC GGCATCGATC CTGACAAGAT CCGCGTCCGC 
CAGGGCGATA CCGACACGAT TCCGCAGGGT GGCGGCACCG GCGGCGCGCG CAGCCTTTAT 
TCCGAGGGCC AGGCCATCGC GCTGACCACC GCGACCATTC TCGAAAAGGG CCGCAAGGCC 
GCGGCCGATC ATCTGGAGGC CGCGGAGGCC GACATCGTGT TCCAGGACGG CGCGTTCCGC 
ATCGTCGGCA CCGACCGGGC GGTCGACGTC ATCACCCTGG CGGCGGACCT GCACGGCGAT 
CAGGGCAACG CGCTCGATAC CGCCGAGATC GCCAAGATCG AGAAGCACAC CTTCCCGAAC 
GGCTGCCACA TCGCCGAGGT CGAGATCGAT CCGGAAACCG GCGTCACCTC GGTGCTGCGC 
TATCTGGTGT GCGACGATGT CGGCACCATC GTGAATCCGA TGATCGTGCG CGGCCAGGTG 
CATGGCGGCG TCGCCCAGGG GCTCGGGCAG GCGCTGCTGG AGAACACCGC CTACGACCCG 
GAGTCGGGCC AGCTCGTCGC CGGCAGTCTG ATGGACTATG CGCTGCCCCG CGCCGACGAC 
CTGCCGGATA TCGAGGTGGA GTTCGTCTCG GTGCCCTGCG CCTCGAACCC GCTCGGCGTG 
AAGGGCGCGG GCGAGGCCGG CGCCGTCGGC TCGCCGCCGG CGCTGATCAA CGCGGTGATC 
GACGCGCTTG CCGTCGACGG TATCCGCGAG ATCGACATGC CGGCGACGCC CGAGCGCGTC 
TGGCAGGCGA TCTCGGCGCG GCAGGCCGCT TGA

Protein sequence

MVKFGLAQPV KRVEDSRLLR GAGQYTDDVP GEGALHLHVL RSPHAAATIT GIDAEAARAV 
PGVVAIVTGA DLAAEGIAPI PCMVPIKNQD GTPRAQADRP ALAQGAVRHV GEPVAYIVAE 
TAQAARDAAE LVDVRYDTKP SITDLASAMS DSAPRVHEDA PANRVFDWAV GDAAKVDELF 
AAAAHVTKLR IVNNRIVVNS LEPRAARAEF DAASGRWTLT TNTQGGWLLK DCLAGAVFKV 
EPAKFRVITP DVGGGFGMKL FVYPEHVMVC HAARKLGRPV KWTSERSEAF LSDTHGRDHI 
TIGELALDAD HRITAMRVTD TANMGAYLSN FGPFIPTLAG TKVLASVYGM KAIHARVFGV 
FTNTVPVDAY RGAGRPESNY LVERLIDAAA RELGIDRAEL RRINMVPASA MPFTTAMAQT 
YDSGDFHKVL DHALDMIDWK GFPARRAKSA AAGKRRGIGM AYYLEATGGA PEERAEIRFT 
RDGHVDVYVG TQSTGQGHET AYVQLVNDRL GIDPDKIRVR QGDTDTIPQG GGTGGARSLY 
SEGQAIALTT ATILEKGRKA AADHLEAAEA DIVFQDGAFR IVGTDRAVDV ITLAADLHGD 
QGNALDTAEI AKIEKHTFPN GCHIAEVEID PETGVTSVLR YLVCDDVGTI VNPMIVRGQV 
HGGVAQGLGQ ALLENTAYDP ESGQLVAGSL MDYALPRADD LPDIEVEFVS VPCASNPLGV 
KGAGEAGAVG SPPALINAVI DALAVDGIRE IDMPATPERV WQAISARQAA