Gene VC0395_A0796 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A0796
Symbol	trpE
ID	5135227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	805797
End bp	807368
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	51%
IMG OID	640532254
Product	anthranilate synthase component I
Protein accession	YP_001216746
Protein GI	147673289
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00565] anthranilate synthase component I, proteobacterial subset

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGG CCATCAACAT AAAGAAAACC GCGCCGCTTG AGGTGCTACA CAGTGAATTG 
CCTTATACGC AAGATCCTAC GGCTTTATTT CATGCTCTTT GCGCTGGGCG CAGCGACTGC 
CTACTACTGG AATCTGCAGA AATCGACTCC AAGCAAAATT TGAAGAGCCT TCTGTTAGTG 
GATGCTGCCG TGCGCATTGT GTGTGAAGGC CATCAAGTGA CCTATCATGC GCTCAGTGCA 
AACGGCCAAG CGCTGCTCAA CATCATTCAT AGCAACCTCA CTGATCGGAT TCCTTGCAAA 
GTAGAGAAAG CGAAACTTAC CCTCACCTTC TCTACACCCT GTGATACGTT GGATGAAGAC 
TCACGATTGC GCGAAGCGTC TTCTTTCGAT GCGCTACGTT TAGTGCAGCA CAGTTTTGAT 
CTCACTGACC ACGGTAAATT TGCGCTGTTT TTAGGTGGCT TATTTGCCTA CGATTTAGTG 
GCTAACTTTG AACCGCTCGG TGAAGCACCT GCCGACAATC AATGCCCTGA TTACGTATTT 
TATGTAGCAG AAACTCTGAT GGTGATTGAT CATCAGCGTG AAACTTGCCA ACTGCAAGCC 
ACCCAATTCC AACCGGGCGA TGCGCTGCAC AGCCAACTCA AAAGCCGGAT GCGTGAAATT 
CGTGCGCAAG TGAATCAAAA ATTGCCTTTG CCGAGTGCGC AATCTTTATC TGATGTGGAA 
GTGACCACCA ATATTAGCGA TGCAGCATTT TGCGATATCG TGCGTGACCT CAAGCAGTAC 
GTGGTCAAAG GCGATGTGTT CCAAGTTGTG CCTTCGCGCC GTTTTCGCTT ACCTTGCCCT 
TCACCACTCG CAGCTTATCA ACGGCTGAAA CAGAGTAACC CAAGCCCTTA CATGTTCTAC 
ATGCAAGATG AACGCTTTAC CCTGTTTGGC GCATCCCCCG AAAGCGCACT CAAGTATGAA 
ATGCACACCA ACCAAGTGGA AATCTACCCG ATTGCAGGGA CTCGCCGCCG CGGTAAGCGC 
GCCGATGGCA GCATCGATTT TGACCTCGAT AGCCGCATTG AGCTTGAACT GCGCACCGAT 
AAAAAAGAGA ACGCCGAACA CATGATGCTG GTTGACTTAG CACGCAACGA TGTCGCGCGC 
ATTAGCCAAG CCGGTACTCG CCATGTCGCT GACTTGCTGC AAGTAGATCG CTACAGCCAT 
GTGATGCACT TGGTGTCGCG CGTGGTGGGT CAGTTACGTG AAGATCTGGA TGCGCTGCAT 
GCTTATCAAG CTTGCATGAA CATGGGCACG CTGACTGGCG CACCGAAAAT TCGCGCGATG 
CAGTTAATCC GCGATGTGGA ACAAGCGCGT CGCGGCAGCT ACGGCGGCGC GGTGGGTTAT 
CTCACGGGTG AAGGCGATTT GGATACCTGT ATCGTGATCC GTTCTGCTTA TGTGGAAAAC 
GGCATCGCCC AAGTCCAAGC TGGCGCGGGT GTCGTTTACG ACTCCGACCC ACAAGCCGAA 
GCCGATGAAA CGCGCGGCAA GGCGCAAGCG GTAATCTCCG CTATTTTATA TGCTCATCAA 
GGGAAGGAAT GA

Protein sequence

MNKAINIKKT APLEVLHSEL PYTQDPTALF HALCAGRSDC LLLESAEIDS KQNLKSLLLV 
DAAVRIVCEG HQVTYHALSA NGQALLNIIH SNLTDRIPCK VEKAKLTLTF STPCDTLDED 
SRLREASSFD ALRLVQHSFD LTDHGKFALF LGGLFAYDLV ANFEPLGEAP ADNQCPDYVF 
YVAETLMVID HQRETCQLQA TQFQPGDALH SQLKSRMREI RAQVNQKLPL PSAQSLSDVE 
VTTNISDAAF CDIVRDLKQY VVKGDVFQVV PSRRFRLPCP SPLAAYQRLK QSNPSPYMFY 
MQDERFTLFG ASPESALKYE MHTNQVEIYP IAGTRRRGKR ADGSIDFDLD SRIELELRTD 
KKENAEHMML VDLARNDVAR ISQAGTRHVA DLLQVDRYSH VMHLVSRVVG QLREDLDALH 
AYQACMNMGT LTGAPKIRAM QLIRDVEQAR RGSYGGAVGY LTGEGDLDTC IVIRSAYVEN 
GIAQVQAGAG VVYDSDPQAE ADETRGKAQA VISAILYAHQ GKE