Gene Athe_2647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2647
Symbol
ID	7407011
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2779187
End bp	2780242
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	39%
IMG OID	643717016
Product	biotin synthase
Protein accession	YP_002574485
Protein GI	222530603
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000036845
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAA AAGATATTTT GGAAAAAGCA TGTTATGAGA ATATTCTCAC AAAAGATGAG 
ATAAAACTTT TGCTGATGGC AGAAGGTGAT GATAAAGAAC TTCTTTTCAA AACAGCTGAT 
AGTGTAAGAA AAGAACATGT TGGAGATGAG GTCTTTTTAA GAGGGCTTAT TGAATTTTCA 
AGCTACTGCA AAAACGACTG TTTTTACTGT GGTCTGAGAC GAAGCAATAG CCAAGCTCAG 
CGTTACAGAA TGCAGGAAGA TGAGATTGTA GAGGTTGCGA AAAGGGCGTA TCAGATGGGG 
TACCGCACGG TTGTATTGCA GTCTGGTGAG GATATGTATT ACACCAAAGA CATGCTGTGT 
TCAATTATAA AAAAGATAAA AAGTAGCGTG GATGTTGCTA TAACACTTTC AATTGGTGAA 
AGGTCATATG ATGAGTACAA GGCATTCAAA GATGCCGGAG CAGACAGGTT TTTGATGAGA 
TTTGAAACTT CAAACAAAAA GCTATATAGA AAATATCATC CCGGAATGAG CTTTGAAAAC 
AGGATAGAAT GTCTCAAATG GATAAAAAAT CTTGGGTATG AGCTTGGGAC AGGTTTTTTG 
ATAGGTCTTC CGGGGCAAAC TATTGATGAT TTGGCACAGG ATATACTTCT TGTAAAAGAG 
CTGGATGCAG ATATGATAGG CATAGGACCT TTTATTCCTC ATCCACAGAC GCCTCTAAAA 
GATGCAGAGG AAGGTTCGGT GGATTTAACT TTAAAGAGCA TTGCCATTTT GAGGCTTTTG 
ATTCCAGATG CTAATATTCC TGCAACAACT GCGCTTGGCA CTTTAGACCC TCTTGGAAGA 
CAAAAAGGTC TCATGTGCGG TGCAAACATT GTGATGCCAA ATGTAAATGA CCTTGAGTAC 
AAGCTCAAAT ATGAGTTGTA TCCTGGAAAG ATTTGCATAA ATGAAGATGC GACAAAGTGC 
AGAGGTTGTA TTGAGTCAAT TATAGTTTCG CTTGGTAGAA AAGTTGGACA GGGAAAAGGA 
CAAAGCAGGC ATTACAAAAG AGCTGCTGCG TCTTAA

Protein sequence

MKVKDILEKA CYENILTKDE IKLLLMAEGD DKELLFKTAD SVRKEHVGDE VFLRGLIEFS 
SYCKNDCFYC GLRRSNSQAQ RYRMQEDEIV EVAKRAYQMG YRTVVLQSGE DMYYTKDMLC 
SIIKKIKSSV DVAITLSIGE RSYDEYKAFK DAGADRFLMR FETSNKKLYR KYHPGMSFEN 
RIECLKWIKN LGYELGTGFL IGLPGQTIDD LAQDILLVKE LDADMIGIGP FIPHPQTPLK 
DAEEGSVDLT LKSIAILRLL IPDANIPATT ALGTLDPLGR QKGLMCGANI VMPNVNDLEY 
KLKYELYPGK ICINEDATKC RGCIESIIVS LGRKVGQGKG QSRHYKRAAA S