Gene BAS1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1990
Symbol
ID	2848351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1995931
End bp	1997100
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	34%
IMG OID	637505240
Product	nitrate transporter
Protein accession	YP_028253
Protein GI	49185001
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.019185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGTC CTAATTTTCA ATTAAGTTTA CAAACTTCTA ATCTAATTAT CGGTTTTATG 
GTGTGGGTTA TTTTATCATC ATTAATGCCC TATATTAAAG TGGATATCCC ATTAACTGCG 
GGACAAATTT CTATGGTAAC AGCAGTACCC GTTATTTTAG GGTCTGTTCT TCGTATTCCA 
ATTGGTTATT GGACAAATCG TTTCGGAGCA AGAAAATTAT TCTTTATTAG TTTTATTCTA 
TTATTATTTC CTGTTTTTTA TATTAGTGTT GCCAATTCTA TGATGGATTT AATTATTGGT 
GGATTATTTG TAGGAATCGG TGGTGCTGTA TTCTCTGTAG GAGTAACTTC TTTACCAAAA 
TACTTTCCAA AAGAGAGTCA CGGTTTTGTA AATGGTATTT ACGGTGTCGG TAACGCTGGA 
ACAGCAATTA CTTCATTTTT AGCGCCTGTT ATCGCAACTT CAGTTGGCTG GAGAACGACA 
GTACAGTGTT ATTTAGTTTT ACTTGCAGCG TTTGCACTTA TGAACTTTTT ATTAGGTGAT 
CGTAAAGAGA AAAAAGTGAA TACACCACTA ATGGAACAAA TAAAAGGTGT ATATAAAAAT 
GAGAAACTTT GGTTTTTATG TATCTTTTAC TTTTTAACTT TCGGATCATT TGTTGCATTT 
ACCGTATACT TACCAAACTT TTTAGTATCT CATTTCGGAT TAGAGAAAGT AGATGCAGGT 
ATGCGGACAG CCGGATTCAT CGTACTCGCA ACAATTATGC GTCCGATTGG TGGTTGGCTC 
GGTGATAAAT TTAACCCATT TAAAATATTA ATCTTCGTAT TTATCGGTTT AACACTTTCA 
GGTATTATTT TATCATTTAT GCCAAGCATG AACGTATATA CATTCGGTTG CCTATTAGTC 
GCATTTTGTG CAGGTATCGG TAATGGTACA ATTTTCAAAC TCGTTCCGAT GTATTTCTCA 
GAACAAGCTG GTATTGTAAA TGGACTCGTT TCAGCTTTAG GCGGACTTGG AGGATTCTTC 
CCGCCACTAA TTTTAACATT ACTGTTCCAA CTAACAGGTC ATTATGCAAT TGGATTTATG 
GCGTTATCAG AAGTCGCACT TGCTTGTTTA ATCATTACAG TATGGATGTA TAGTCAAGAA 
AAGCTGTTAG TGATGTTAAA GAATCATTAA

Protein sequence

MKSPNFQLSL QTSNLIIGFM VWVILSSLMP YIKVDIPLTA GQISMVTAVP VILGSVLRIP 
IGYWTNRFGA RKLFFISFIL LLFPVFYISV ANSMMDLIIG GLFVGIGGAV FSVGVTSLPK 
YFPKESHGFV NGIYGVGNAG TAITSFLAPV IATSVGWRTT VQCYLVLLAA FALMNFLLGD 
RKEKKVNTPL MEQIKGVYKN EKLWFLCIFY FLTFGSFVAF TVYLPNFLVS HFGLEKVDAG 
MRTAGFIVLA TIMRPIGGWL GDKFNPFKIL IFVFIGLTLS GIILSFMPSM NVYTFGCLLV 
AFCAGIGNGT IFKLVPMYFS EQAGIVNGLV SALGGLGGFF PPLILTLLFQ LTGHYAIGFM 
ALSEVALACL IITVWMYSQE KLLVMLKNH