Gene BAS4668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4668
Symbol
ID	2850811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4561298
End bp	4562518
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	32%
IMG OID	637507902
Product	sensor histidine kinase
Protein accession	YP_030912
Protein GI	49187659
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.304477
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAAG ACGGTATATT TAAAAATGAA GAAATGAAGG CGCTAAAAAT ATTTTTAAGT 
TTATTTTTCA TTATATTTTT TGTATACGAT CTTGCCTACG AATTTATTGT ACCTTTAATA 
GGAGGAGAGC AAGAAGGAGT AGGACAATTT GAAGATGGTT TAGGTTTATG GCTTTATTTT 
CTGATGGTGG TCCTATTTTG CACTGGAATA TACTTTATGA AATGGAAGAA TCCATTTGCA 
GTGAAATATA TTATACTAAT TGGATATAAT CTATTAGATT TTATCCATAA TTTTATGATT 
TACTATGGTA GTGATGCTGA GTTTGATGGT GGGAATATAG TAGAAGGATT TTTTATTTTA 
TTTGCCCCAC TCTTTGTGAA TAAAAGATAT TTTTGGTTAG TTCCGAGCAT ACTTATTGGA 
AAATACGCTC TTACTGGAAT CATCATTCAC TCGTCACTCG TTTTAATCCC GATGGCATTA 
TATGGCGTAT TTACTATCAT ATGTTGGATT ATGTTTTTAA GATTTCACTC TTACGTTCGC 
ACGCTTGAGA TGATGGATAA AGAAATACAA CAAACAGAAA AGCTAGCAAC TGTTGGGAAA 
ATGGCTACAG TTATTGGTTA CAAAATTAAA AGACCTTTAG CTAATTTAGA TAAATTTGTT 
AATAAGCAAG CGATTAAATA TCCAGAGGAC AAAATATATA GTGATATTAT GAAACAAGAA 
GTAGAACGAA TTCATATAAT AGCTACAGAA CTTAGTGGAT TTGAGAAATC TAAATCAATA 
GAATCAGAAG TTCATAATAT AGAAGAAATT ATCGCTTATG TTATTCGAGT TATGGGGAAG 
CCTGCATTAA ATCAAGGCGT GCACATACAA GGTATTTATA GTAAAGACAT ACCATCGATT 
ACATGCGATG AAAAACGATT AAAACAAGTA TTTTTTAATT TAATTAAAAA TGCGATTGAA 
GCAATGTCAG TTGGCGGAAC GATTACAATT AAAGTGACTG TAGAAGATGC AATCATTATT 
CAAGTGAAGG ATGAGGGTTG CGGCATTCCA AAAGAAAAAA TTCCTAAGTT AAACGAAGCC 
TTTTACACAA CGAAAGAAAC GGGAACAGGT TTAGGTTTAG TAGTTACAGA AAAAATTATT 
AAAGATCACA ATGGTAAAAT GAGTTTTGAA AGTGAAGTTG GGGTTGGAAC GACGGTGAAG 
GTTATGTTGC CGATACAATA A

Protein sequence

MNKDGIFKNE EMKALKIFLS LFFIIFFVYD LAYEFIVPLI GGEQEGVGQF EDGLGLWLYF 
LMVVLFCTGI YFMKWKNPFA VKYIILIGYN LLDFIHNFMI YYGSDAEFDG GNIVEGFFIL 
FAPLFVNKRY FWLVPSILIG KYALTGIIIH SSLVLIPMAL YGVFTIICWI MFLRFHSYVR 
TLEMMDKEIQ QTEKLATVGK MATVIGYKIK RPLANLDKFV NKQAIKYPED KIYSDIMKQE 
VERIHIIATE LSGFEKSKSI ESEVHNIEEI IAYVIRVMGK PALNQGVHIQ GIYSKDIPSI 
TCDEKRLKQV FFNLIKNAIE AMSVGGTITI KVTVEDAIII QVKDEGCGIP KEKIPKLNEA 
FYTTKETGTG LGLVVTEKII KDHNGKMSFE SEVGVGTTVK VMLPIQ