Gene BAS5147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS5147
Symbol
ID	2852792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	5031081
End bp	5032181
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	44%
IMG OID	637508402
Product	NADH dehydrogenase subunit D
Protein accession	YP_031386
Protein GI	49188133
COG category	[C] Energy production and conversion
COG ID	[COG0649] NADH:ubiquinone oxidoreductase 49 kD subunit 7
TIGRFAM ID	[TIGR01962] NADH dehydrogenase I, D subunit

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCGTA CGGAAGAAAT GCTTTTGAAT GTAGGTCCTC AGCATCCGAG TACCCACGGT 
GTGTTCAGGC TTGTTATTAA GATTGACGGG GAAATTATTA AAGAAGCTAC ACCAGTTATT 
GGATATTTGC ATCGCGGAAC CGAAAAGATT GCAGAGAGCT TACAGTATAC GCAAATTATC 
CCTTATACAG ATCGGATGGA CTATTTATCG GCTATGACGA ATAATTACGT CATTTGCCAT 
GCTGTAGAGA CGATGATGGG GCTTGAAATC CCGGAGCGGG CCGAATACTT GCGAGTACTT 
GCAATGGAGC TTGGAAGGAT TGCGAGCCAC CTCGTTTGGT GGGGGACAAA TCTTCTTGAT 
ATAGGAGCAG TTAGCCCGTT TTTGTACGCG TTCCGTGAGC GAGAAATGAT TATTAATTTA 
TTAAACGAAT TATGCGGTGC ACGGCTTACT TTTAATTATA TGAGAGTCGG CGGTGTGAAA 
TGGGATGCAC CGGATGGTTG GATTGAAAAA GTGAAAGAAT TTGTTCCGTA TATGAGAGAA 
CAATTGGCAG GGTATCATGA TCTTGTTAGC GGCAATGAGA TTTTCTTAAA TCGTGTAAAA 
GGCGTTGGTA TATATAGCGC GGAGGAAGCG ATTTCGTATT CTTTAAGCGG AGCGAATTTG 
CGGTGTACCG GAGTAAACTG GGATCTTCGC AAGGATGAAC CATATTCCAT TTATGATCGT 
TTTGACTTTG ATATTCCTGT TGGGAGCGTG GGGGATGCCT GGGATCGCTA CGTTTGCCGC 
ATGCAGGAAA TTGAGGAGTC TTTAAAGATT GTTGAGCAAG CAGTCCAGCA GTTCCCAAAA 
GAAGGAGCTG TACTGGCGAA AGTACCGAAA ATTATTAAGG CGCCTAAAGG GGAAGCGTTC 
GTCCGTATAG AATCGCCGCG CGGAGAGATT GGTTGTTATA TTGCTAGTGA TGGGAAGAAA 
GAGCCATACC GTTTGAAGTT TCGCAGGCCG TCTTTTTACA ATTTGCAAAT TTTACCGAAG 
TTATTGAAAG GTGAAAACAT CGCCAATTTA ATTACGATTT TAGGTGGAGT GGATATTGTA 
CTTGGGGAGG TTGATGGCTA A

Protein sequence

MIRTEEMLLN VGPQHPSTHG VFRLVIKIDG EIIKEATPVI GYLHRGTEKI AESLQYTQII 
PYTDRMDYLS AMTNNYVICH AVETMMGLEI PERAEYLRVL AMELGRIASH LVWWGTNLLD 
IGAVSPFLYA FREREMIINL LNELCGARLT FNYMRVGGVK WDAPDGWIEK VKEFVPYMRE 
QLAGYHDLVS GNEIFLNRVK GVGIYSAEEA ISYSLSGANL RCTGVNWDLR KDEPYSIYDR 
FDFDIPVGSV GDAWDRYVCR MQEIEESLKI VEQAVQQFPK EGAVLAKVPK IIKAPKGEAF 
VRIESPRGEI GCYIASDGKK EPYRLKFRRP SFYNLQILPK LLKGENIANL ITILGGVDIV 
LGEVDG