Gene VC0395_A1699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1699
Symbol	aroC
ID	5136269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1825313
End bp	1826398
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	51%
IMG OID	640533156
Product	chorismate synthase
Protein accession	YP_001217638
Protein GI	147675123
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGGAA ACAGTATCGG ACAACATTTC CGAGTCACCA CATTCGGAGA AAGTCACGGT 
ATCGCACTGG GATGTATTGT CGATGGTTGC CCACCGGGGC TCACCATCAG CGAAGCGGAT 
TTACAAGTGG ATCTTGACCG TCGTCGCCCC GGCACATCGC GTTATACCAC CCAGCGTCGC 
GAGCCGGATG AAGTCAAAAT TCTCTCTGGT GTGTTTGAGG GCAAAACCAC AGGCACATCG 
ATTGGGCTAT TGATCGAAAA CACTGACCAA CGCTCTAAAG ATTATTCGGA TATTAAAGAC 
AAATTCCGTC CCGGACATGC GGACTACACC TATCATCAAA AGTACGGTGT GCGAGATTAC 
CGTGGCGGCG GCCGTTCATC GGCACGTGAA ACCGCCATGC GTGTTGCGGC GGGAGCGATT 
GCCAAAAAAT ACCTGCAGCA AGAGTTTGGC ATTGAAGTGC GTGCTTACTT GTCGCAAATG 
GGGGAGGTCG CGATTGATAA AGTGGATTGG AATGAGATTG AAAACAACGA TTTCTTCTGC 
CCTGATGTCG ATAAAGTGGC TGCGTTTGAC GAGCTGATCC GCGAGCTGAA AAAAGAAGGC 
GATTCGATCG GCGCCAAAAT CCAAGTGGTT GCTACTGGCG TTCCAGTTGG CTTGGGTGAG 
CCTGTGTTTG ATCGCTTAGA TGCGGATATT GCCCATGCCT TGATGAGCAT CAACGCCGTG 
AAAGGAGTCG AGATTGGTGA TGGCTTTGAT GTAGTGCGCC AAAAAGGCAG CCAACATCGT 
GACCCGCTCA CTCCACAAGG TTTCCGCTCT AACCATTCCG GTGGCATTTT AGGCGGTATC 
TCTAGCGGGC AAGATATTGT TGCTAATATT GCGTTGAAGC CAACGTCCAG CATTACCGTG 
CCGGGTGAAA CAATTGATGT TAACGGTGAG CCAACCGAGC TTATCACCAA AGGTCGTCAT 
GACCCTTGTG TGGGGATTCG CGCTGTACCG ATTGCAGAAG CCATGTTGGC GATTGTGCTG 
ATGGATCATC TGCTGCGTCA TCGTGGTCAG AACCAAGGTG TCGTAACGAC AACACCGAAA 
ATTTAG

Protein sequence

MAGNSIGQHF RVTTFGESHG IALGCIVDGC PPGLTISEAD LQVDLDRRRP GTSRYTTQRR 
EPDEVKILSG VFEGKTTGTS IGLLIENTDQ RSKDYSDIKD KFRPGHADYT YHQKYGVRDY 
RGGGRSSARE TAMRVAAGAI AKKYLQQEFG IEVRAYLSQM GEVAIDKVDW NEIENNDFFC 
PDVDKVAAFD ELIRELKKEG DSIGAKIQVV ATGVPVGLGE PVFDRLDADI AHALMSINAV 
KGVEIGDGFD VVRQKGSQHR DPLTPQGFRS NHSGGILGGI SSGQDIVANI ALKPTSSITV 
PGETIDVNGE PTELITKGRH DPCVGIRAVP IAEAMLAIVL MDHLLRHRGQ NQGVVTTTPK 
I