Gene BAS3071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3071
Symbol
ID	2848884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3051891
End bp	3052919
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	34%
IMG OID	637506315
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_029328
Protein GI	49186076
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.316451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTAA CTAAAGATTT AGAAAATATA ATTTTAGATC ATGGAACAGG AGGACTATTG 
AGTCAGGATT TAATTAGTTC AATTATTACT GCAAAACTAG AAGATGTTCA CCTTGGAAAA 
ATGGAGGATA GTGCCATTCT TGAGGTAAGT AGTAGAAGAT TGGCGATGAC AACAGATTCT 
TTTGTTATTG ATCCTATCTT TTTTGGTGAG GGGAATATAG GTAAAGTAGC AGTTTGTGGA 
ACGGTTAATG ATTTAGCGGT TAGTGGTGCA AAACCACTTT ATCTATCATT GGCATTAGTA 
CTAGAAGAGG GTTTTCCAAT TAAAGATTTG GAAGAAATAT TAGATTCTAT AAGAGAGACC 
GCGAAAGAAG CTGGAGTGTA TATTGTTGCT GGTGATACAA AAGTTGTTAA AAAAGGTGAA 
GTAGACAAAA TCTTTATTAA TACAACTGGA ATAGGAGTTT TTGAAGGAGA TGTAGCACCG 
TTTTCGGTAA ACTCTATTCA AGAAGGTGAC GATATCATTA TAACAGGACA ACTAGGAAAC 
CATAGTATAC ATATCCTTTC TATCAGAGAA GGATTAGGGT TTGAACAGAG AATAAATAGT 
GATTGTGCAC CATTAAATCA TATGATTACA GAGTTAAAAA ATCATTTTGG TGATTCTATA 
CATTGTATGC GAGATATTAC AAGAGGCGGG TTAGGTACAG TTTTAAATGA AGTCTCAGAA 
ACAATTAATA CTGGAATAAA AATACAAGAA AAAGATATTC CTATGTTAGC AGAAACTATT 
ATGGCTGCCG ACATGTTAGG TGTTAATCCA ATGTATCTAG CTAATGAGGG CAATGTTTGT 
ATGTTTGTGT CTCCAGAGGT AAGTGAGGAA GTCGTGAGGG TATTAAAAAA TACTAAATAT 
GGTAAAGAAG CTGCGGTAAT TGGTAAAGTT ACTCAAACAA AAGAAAGACA AGTACTCATG 
GAAGCAAAAT CAGGTGAATT GAAACTCATT GAGTTATTAT ATGGGGCAGA ATTACCTCGA 
TTATGTTAG

Protein sequence

MKLTKDLENI ILDHGTGGLL SQDLISSIIT AKLEDVHLGK MEDSAILEVS SRRLAMTTDS 
FVIDPIFFGE GNIGKVAVCG TVNDLAVSGA KPLYLSLALV LEEGFPIKDL EEILDSIRET 
AKEAGVYIVA GDTKVVKKGE VDKIFINTTG IGVFEGDVAP FSVNSIQEGD DIIITGQLGN 
HSIHILSIRE GLGFEQRINS DCAPLNHMIT ELKNHFGDSI HCMRDITRGG LGTVLNEVSE 
TINTGIKIQE KDIPMLAETI MAADMLGVNP MYLANEGNVC MFVSPEVSEE VVRVLKNTKY 
GKEAAVIGKV TQTKERQVLM EAKSGELKLI ELLYGAELPR LC