Gene VC0395_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_0474
Symbol
ID	5134297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	-
Start bp	529190
End bp	530641
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	48%
IMG OID	640530797
Product	putative formate transporter 1
Protein accession	YP_001215315
Protein GI	147671415
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG0517] FOG: CBS domain [COG2116] Formate/nitrite family of transporters
TIGRFAM ID	[TIGR00790] formate/nitrite transporter

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000000000188118
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCAG CCTACTCTAA AAATCAAAAC TGCTTTTCAC CCACGGAAAT GATGGCAGAA 
GCAGAAAAGT TCGCACTGAG TAAAGCGAAA AAAACCAGCG GCATGATCTT AGGTCTTTCG 
GTTATGGCGG GCGCTTTTAT CGGTTTGGCT TTTCTGTTCT ACATTACCGT CACCACAGGC 
AGCGCTTCTG CCGGCTGGGG ATTGAGCCGA CTGGCGGGTG GTGTAGCGTT CAGTATGGGG 
CTGATTTTGA TCGTCATCTG CGGTGGCGAG TTGTTCACAA GCTCTGTGCT ATCTAGCATC 
TCATGGGCAA ATCGCGAAAT CAGTTTTGGA AAAATGCTCT CTATCTGGGG CAAGGTGTAC 
GTCGGTAACT TTATCGGTGC CATTTTTCTA CTGCTTTTGG TGACAGCGGC TGGCCTTTAC 
CAGCTTGATG AAGGCCAATG GGGTTTAAAT GCCCTCAATA TTGCGCAGCA CAAACTTCAT 
CACACCACAG TACAAGCTTT TGCTTTAGGC ATTCTATGTA ACCTACTGGT TTGTTTGGCT 
ATTTGGCTGA CCTTCAGTTC AGCGAATGCT ATGACTAAAG CGGCCATGAC CATCATGCCT 
GTCGCGATGT TTGTTTCTAG CGGCTTTGAG CACTGTGTGG CCAATATGTT CATGGTTCCA 
CTGGGTATTG TTATTCAAAA CTTCGCACCA GACAGTTTCT GGCAACAGGT TGGTGTGACA 
GCCAGCCAAT ACAGCGATTT GAATGTCACT CAATTTATTA CGGCGAACTT AATACCGGTC 
ACGCTCGGCA ACATTGTGGG TGGTGCCGTG CTGGTTGGCC TCGCCAACTG GAGCATTTAC 
CGCCGCCCTC AGTTAAAAGC CGCCAATGTT GTCACGATTA CGGAAACTCA AGCACTTACG 
TCAGTCAAGG AAACTCTTAT GAAAAGCACA ATTACAGTAA AAGATATGAT GAACACTCAA 
CCTGTTACCC TCAGCGTTGA GATGACCACT CCAGCCGCGA TCGACACCCT ACTCGACCAC 
CATTTGTCCG CTGCTCCAGT TGTCGATATG CAAGGTCGCT TGGTTGGTGT GCTCTCTAGT 
CACGATGTAA TGGTTGATCT CTGGTGCCAA GACTACTTGC CAAGCCAAGA CCAAAAAGTG 
GTAGATCTGA TGACTCGTGA TGTGATTGCG ATTGATATCA ACGACAAGCT GGTGGATGTT 
GCGGAGTTCT TCTGTATCGA TAAAGAACAG CTATTCCCAA CCACAAGCAT GGGCATTGCC 
ACTCGCTTCA ACGCTCTCTC ATTAGAAGAA CGCGCCAAAA GCATCAAGGT AAACAAACCA 
CATATGCTGC CTGTTCTACA CAATGGTCAG TTAGTGGGAG TACTGGAGCG TAATGATGTG 
CTTGAAGCGC TGCGCCCAAT TTATGGTGAA CGGGTAAGAA TTGTCAAAGA TAAAGCGTTG 
GCTCGCGCTT AA

Protein sequence

MSAAYSKNQN CFSPTEMMAE AEKFALSKAK KTSGMILGLS VMAGAFIGLA FLFYITVTTG 
SASAGWGLSR LAGGVAFSMG LILIVICGGE LFTSSVLSSI SWANREISFG KMLSIWGKVY 
VGNFIGAIFL LLLVTAAGLY QLDEGQWGLN ALNIAQHKLH HTTVQAFALG ILCNLLVCLA 
IWLTFSSANA MTKAAMTIMP VAMFVSSGFE HCVANMFMVP LGIVIQNFAP DSFWQQVGVT 
ASQYSDLNVT QFITANLIPV TLGNIVGGAV LVGLANWSIY RRPQLKAANV VTITETQALT 
SVKETLMKST ITVKDMMNTQ PVTLSVEMTT PAAIDTLLDH HLSAAPVVDM QGRLVGVLSS 
HDVMVDLWCQ DYLPSQDQKV VDLMTRDVIA IDINDKLVDV AEFFCIDKEQ LFPTTSMGIA 
TRFNALSLEE RAKSIKVNKP HMLPVLHNGQ LVGVLERNDV LEALRPIYGE RVRIVKDKAL 
ARA