Gene Athe_2541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2541
Symbol
ID	7409411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2659674
End bp	2660687
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	34%
IMG OID	643716905
Product	biotin synthase
Protein accession	YP_002574382
Protein GI	222530500
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00179392
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGAATT TTCTTCAATC AGTTCAATTT GTCAAAGAAG TTGAAAAAAA GATAATTGAA 
TATGACAAAG ACATTGCCTT CAATGAGGCT ATCATACTTT ATGAAATCGC AAAACATGAT 
GCAGATTTGG TAAAAAATCT CGCCAGTACG ATAAACCAAC ATTATTTTAA AAATACTATT 
GAGCTTTGCT CCATTTATCC TGCAAAGGTA GGACTTTGCC CGCAAGATTG CAAGTTCTGT 
TCCCAGTCTA TCCATCACAG TTGTTTAATT GAAATAAAAG ATCTTGCTGC GCTTGATGAA 
GTAATAGAGT ATCTTGAGTA TGTAATATCT TTTCCAATAA AAAGATTTTG CTTAGTCACA 
AGTGGTGAAA AGCTTGATGA CTCAGAATTT GAAAAAATTT TAGACATCTA TTCACACATC 
TCAAAGAATT ATAACATACT TCTGTGCGCA TCACTCGGCT TTCTTACTCA AGAAAGGGCA 
AAAAAGCTAC TTAAAGTTGG AGTTGTAAAG TATCACAATA ACTTAGAGAC ATCCAGCACA 
TATTTTAAAA ATATCTGCTC CACCCACACT CAACAGCAAA AGATAGAGAC TTTAAAAATT 
GCAAAAGAGG CAGGGCTTCA AATCTGTAGC GGTGGAATAA TCTCAATGGG TGAGGACATG 
ATTGAAAGAA TCAAACTTGC ATTTGAACTA AGAGAATTAG ATGTTGACTC TGTTCCAATC 
AACATATTAA ACCCAATAAA AGGCACGCCT TTAGAAGATA TAAAGATCAT AGACAAAAAC 
GAAATTTTTA TCACCCTGGC ACTATTTAGG ATTGTGCTAC CAAAAAAGAC AATTCTTCTT 
GCAGGTGGAA AAGAAAATGC GCTTGGAGAT ATGGAAAAAA TGGCATATGA GTGTGGCGTA 
AATGGTTGTA TGGTTGGAAA TTATCTTACA ACAAGGGGAA TGGGAATAAG AGAGAAGATT 
GAGATGTTGG AATCCTTGGA TTTAAAGTTT CAAACCAATA TGCATAATAA TTAG

Protein sequence

MLNFLQSVQF VKEVEKKIIE YDKDIAFNEA IILYEIAKHD ADLVKNLAST INQHYFKNTI 
ELCSIYPAKV GLCPQDCKFC SQSIHHSCLI EIKDLAALDE VIEYLEYVIS FPIKRFCLVT 
SGEKLDDSEF EKILDIYSHI SKNYNILLCA SLGFLTQERA KKLLKVGVVK YHNNLETSST 
YFKNICSTHT QQQKIETLKI AKEAGLQICS GGIISMGEDM IERIKLAFEL RELDVDSVPI 
NILNPIKGTP LEDIKIIDKN EIFITLALFR IVLPKKTILL AGGKENALGD MEKMAYECGV 
NGCMVGNYLT TRGMGIREKI EMLESLDLKF QTNMHNN