Gene Sbal223_1931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_1931
Symbol
ID	7090098
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	2281582
End bp	2282781
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	52%
IMG OID	643460835
Product	histidinol-phosphate aminotransferase
Protein accession	YP_002357859
Protein GI	217973108
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.5021
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.393324
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAG TGAGCAGCAT GGAAAAGACA GCAGAACCCG CAGCATTAGC ATCGATGTTA 
GCACCATCAA CGTTAGCGCA ATCGGCGTCG CTAAATTTAG CCGAGCGCCT AGCGCGCCCT 
GAATTACTGG ATTTAACGCC CTACCAAAGT GCCCGCAGAC TGGGCGGTCG TGGTGATATT 
TGGATCAATG CCAACGAATC GCCGTTCAAT AATGTCGATA CGGCAGCGCT CGATTTATCG 
AAATTGAATC GTTACCCAGA ATGCCAACCG CCGCAGCTTA TCAATGCCTA CAGCGAATAC 
AGCGGCGTGA GCGCCAGCAA GATAGTCGCC AGCCGCGGCG CCGATGAAGC GATTGAACTG 
TTAATTCGCG CCTTTTGTAT TCCAGGTGTC GACAGCATCG CCTGCTTTGG CCCGACGTAC 
GGCATGTATG CCATCAGCGC GAACACCTTT AATGTGGGCG TTAAAGCGTT AAATCTCAGC 
GCGGAATATG GCTTGCCGAC AAGCTATGCC GAGGACGTTC GCGGCGCAAA ACTGGTGTTT 
ATCTGCAATC CCAATAATCC GACCGGGACT GTGATCGACA AAGCCATTAT TGAGCAAGCG 
ATCAAAGCCC TGCCCGATTC GCTTGTGGTG ATCGATGAGG CCTATATTGA GTTTTGTCCT 
GAATACAGTG TGGCGGATTT ACTGGAAAGC TATCCGAATC TAGTGGTGCT ACGAACCCTG 
TCAAAAGCCT TTGCACTCGC CGGCGCACGC TGTGGTTTTA TGCTGGCAAA CGAGGCAGTG 
GTCGAAATCA TTATGCGCGT AATTGCACCC TATCCTGTGC CACTGCCCGT GAGTGGGGTC 
GCCACACAGG CGCTATCAAG CGCTGGCGTT GCACGGATGA AAGTGCAAGT TGCACAATTA 
AATGAGCAAG GCGCCAGACT CACAGCGGCG ATCAGCGCTT ATTGTTCAAA ATCGAATAGT 
TCAGATTCGC GCGCCCGCGT GCTTAAGCCT AACGGCAATT ATGTGCTGGC TGAATTTGAT 
GATGTCGCCA AGGTCGCAGC GTTACTGCAA GGCAGCGGCG TTGTCGCCCG CGCCTACAAA 
GACCCAAGGC TTGCCAAGGC TATCCGCTTT AGCTTTAGTT CAAAGGCGGA TACCGATGTG 
TTAGTGAATT TATTTGAATC GCAACACACT GAGCAAGCAC CAGAAACGAA TAATAAGTAA

Protein sequence

MSQVSSMEKT AEPAALASML APSTLAQSAS LNLAERLARP ELLDLTPYQS ARRLGGRGDI 
WINANESPFN NVDTAALDLS KLNRYPECQP PQLINAYSEY SGVSASKIVA SRGADEAIEL 
LIRAFCIPGV DSIACFGPTY GMYAISANTF NVGVKALNLS AEYGLPTSYA EDVRGAKLVF 
ICNPNNPTGT VIDKAIIEQA IKALPDSLVV IDEAYIEFCP EYSVADLLES YPNLVVLRTL 
SKAFALAGAR CGFMLANEAV VEIIMRVIAP YPVPLPVSGV ATQALSSAGV ARMKVQVAQL 
NEQGARLTAA ISAYCSKSNS SDSRARVLKP NGNYVLAEFD DVAKVAALLQ GSGVVARAYK 
DPRLAKAIRF SFSSKADTDV LVNLFESQHT EQAPETNNK