Gene VC0395_A1377 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_A1377
Symbol	dctP-1
ID	5137567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009457
Strand	-
Start bp	1482096
End bp	1483061
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	45%
IMG OID	640532835
Product	C4-dicarboxylate-binding periplasmic protein
Protein accession	YP_001217320
Protein GI	147673037
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID	[TIGR00787] tripartite ATP-independent periplasmic transporter solute receptor, DctP family

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACCA TTAATAAGAT TACTATCGCA ATACTTACTT TGAGTGCTGC TGCTTCTGTC 
AATGCTGCGA CGACTTTAAA GATGGGGATG CAAGCTTCTG TGGGGTCTGT AGAGTATAAC 
TCGGCAAAAA TGCTTGCCGA CACATTAGAA GAAATGAGTC AAGGAGAGAT CAAACTCGCT 
TTGTACCCAA GCGCCCAGCT TGGTGATGAT CGTGCCATGC TTCAGCAATT GACGCTGGGA 
GATCTCGATA TAACTTATGC TGAGTTTGGT CGTATGGGGC TTTGGATACC GCGAGCAGAA 
GCGGTCATGC TCCCTTATGT CGCGAAAGAT TTTGACCATT TACGCCGCAT GTTTGAATCT 
GACTTTGGTC AAGGTGTTCG TGATGAAATG CTCCAGAAGT TCAACTGGCG TGCTTTGGAC 
ACTTGGTATA ACGGTACCCG TGAAACCACT TCAAACCGTC CCCTCAATTC GATTGAAGAT 
TTTAAAGGGT TAAAACTTCG AGTCCCGAAT GCTAAGCAAA ACCTCAACTA TGCAAAGCTG 
TCTGGTGCCT CGCCAACCCC GATGTCATTC TCTGAAGTTT ATTTAGCGCT GCAGACCAAT 
GCCGTAGATG GGCAAGAAAA CCCGCTACCA ACAATTAAAA CAATGAAGTT CTATGAAGTG 
CAAAAGAACT TAGCCATGAC ACATCATATT GTTAACGATC AAATGGTGAT CATTTCGGAA 
TCTACTTGGC AGAAGCTTTC TGATACGGAT AAAGACATCA TTCAGAAAGC CGTGCAGAAA 
GTGGGAGATG CTCATACACA GACCGTTAAA ACTCAAGAGG CAGAATTGGT CTCCTTCTTC 
AAGAGTGAAG GTATCAACGT GACTTACCCA GATCTGGAGC CATTCCGAGA AGCGATGCAA 
CCACTTTACA AGGAGTTTGA CAGTAACATC GGTCAGCCGA TTGTGTCGAA ATTGGCAGCA 
ATGTAA

Protein sequence

MKTINKITIA ILTLSAAASV NAATTLKMGM QASVGSVEYN SAKMLADTLE EMSQGEIKLA 
LYPSAQLGDD RAMLQQLTLG DLDITYAEFG RMGLWIPRAE AVMLPYVAKD FDHLRRMFES 
DFGQGVRDEM LQKFNWRALD TWYNGTRETT SNRPLNSIED FKGLKLRVPN AKQNLNYAKL 
SGASPTPMSF SEVYLALQTN AVDGQENPLP TIKTMKFYEV QKNLAMTHHI VNDQMVIISE 
STWQKLSDTD KDIIQKAVQK VGDAHTQTVK TQEAELVSFF KSEGINVTYP DLEPFREAMQ 
PLYKEFDSNI GQPIVSKLAA M