Gene VC0395_A1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1941
Symbol	thrC
ID	5135554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	2070829
End bp	2072109
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	50%
IMG OID	640533398
Product	threonine synthase
Protein accession	YP_001217865
Protein GI	147673667
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0392149
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCTGT ACAACATAAA AGAAAATGAT GAACAAGTCT CTTTTGGTCA AGCCGTTCGC 
CAAGGGTTAG GCCGCAATCA AGGCCTATTT TTTCCGGCAC AATTGCCGAA GTTTGACGAT 
ATTGATGCGC TATTAGCCGA AGATTTCGTC TCTCGTAGCA GCAAGATTTT ATCGGCGTTG 
ATTGGCGATG AACTGCCTGC GGATAAAATT CGCGCTATGG TGGATTCCGC CTTTCAATTC 
GCCGCACCGA TTGCCAAAGT GAAAGAGGGC GTTTACGCGC TCGAATTGTT CCACGGGCCA 
ACGCTCGCGT TTAAAGATTT TGGTGGTCGC TTTATGGCCC AGTCTCTGGC GGCGGTCTCG 
AACGGCGGAA AAATCACGAT TTTGACGGCG ACATCCGGTG ATACCGGCGC TGCTGTTGCG 
CACGCATTTT ATGGCATGCC AGATATTAAT GTTGTGATCC TTTATCCGAA AGGAAAAATC 
AGTCCGCTGC AAGAAAAGCT GTTCTGCACA TTAGGTAAAA ACATTCACAC CGTGGCGATC 
AATGGTGATT TTGATGCTTG CCAAGCGCTA GTGAAACAAG CTTTTGATGA CGCAGAGCTG 
CGTCAACAGA TCGGTTTGAA CTCCGCCAAC TCGATCAACA TCAGCCGTTT GATGGCGCAA 
ATCTGTTACT ACTTTGAAGC CGCTGCGCAG ATGAGCAAAG CTGAGCGTGA AAATCTGGTG 
ATTTCAGTGC CTAGTGGCAA CTTTGGTAAC TTAACCGCAG GGCTGTTAGC CAAAGCACTG 
GGTTTATCGG TGAAGCGCTT TATTGCGGCA ACCAATGCCA ACGATACAGT GCCACGTTAC 
TTGGAAACGG GACGTTGGGA ACCCAAACCC ACGGTAGCAA CAACGTCAAA TGCGATGGAT 
GTCAGCCAAC CGAACAACTG GCCGCGTATC GAAGAGCTCT GCCAACGTAT GGGATGGGGC 
TTAGAAACGC TGGGCAAAGG CGCGGTTTCT GACGAGGAAA GTGCGCAAGC CGTACAAGAA 
CTTTACGATC TAGGCTACTT GTGTGAACCG CATGGTTCGA TTGCTTACCG TGTATTGGAA 
GAGCAGCGCC AGCTGCAAGA AACGGGGCTG TTCTTATGTA CCGCGCATCC CGCCAAATTC 
AAAGAAGTGG TGGACGATAT TTTAGGTACC GACATTGCTC TACCAGCGCC ATTGGCAAAA 
CATGCGGCGA TGGAATTGCT CTCACAAGAG CTGAATGCCG ATTTCGCAGC GCTGCGTACG 
TTACTGGTGA ATGTGAAATA A

Protein sequence

MKLYNIKEND EQVSFGQAVR QGLGRNQGLF FPAQLPKFDD IDALLAEDFV SRSSKILSAL 
IGDELPADKI RAMVDSAFQF AAPIAKVKEG VYALELFHGP TLAFKDFGGR FMAQSLAAVS 
NGGKITILTA TSGDTGAAVA HAFYGMPDIN VVILYPKGKI SPLQEKLFCT LGKNIHTVAI 
NGDFDACQAL VKQAFDDAEL RQQIGLNSAN SINISRLMAQ ICYYFEAAAQ MSKAERENLV 
ISVPSGNFGN LTAGLLAKAL GLSVKRFIAA TNANDTVPRY LETGRWEPKP TVATTSNAMD 
VSQPNNWPRI EELCQRMGWG LETLGKGAVS DEESAQAVQE LYDLGYLCEP HGSIAYRVLE 
EQRQLQETGL FLCTAHPAKF KEVVDDILGT DIALPAPLAK HAAMELLSQE LNADFAALRT 
LLVNVK