Gene Sare_3803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3803
Symbol
ID	5704554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	4332499
End bp	4334094
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	71%
IMG OID	641273225
Product	choline/carnitine/betaine transporter
Protein accession	YP_001538587
Protein GI	159039334
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.19587
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACATGG GCGGATCGGC TGGGCGGCCC GGCAGCGGGA GCGTCGACCG GTTGCTGCTG 
TGCCTCGCCG TTGGCGGCGT GCTGGCCGTC GTGGCCTGGG GCGTCCTGGA CCGGGAGTCG 
GTGTCGGCTG TCGGTCAGAC CGGGCTGAAC TGGGTCATCA CCACGTTCGG CTGGTTGTTC 
GTCGTCGCGG CGAACGCCTT TCTGGTGTTG GCCGTGGTGC TGGCACTCTC CCGCTTCGGC 
ACCATTCGGC TGGGGCCCGA CGCCGAGCGG CCGGAGTTCA GCACGTTGGC CTGGGTCGCC 
ATGATGTTCA GCGCAGGCAT GGGGATCGGC CTGGTCTTCT TCGCCGTGGC CGAGCCGATC 
CAGCACTACG CGTCGCCGCC GCCGGCGACC GGGGTCGAGC CGGAGACCGG TGCCGCCGCC 
TCGGCTGCCA TGCAGTTCAC CCTGTTCCAC TGGACGCTGC ACCCGTGGGC GATCTACGCG 
GTGGTGGCGC TCGCCCTGGC GTACTCGACC TTCCGCAAGG GGCGGGAGAA CCGGATCTCG 
GCCGTGTTCC GTCCGGTGCT CGGCGACCGG GCGGACGGCG CGGCCGGACG GGTGATCGAC 
CTGCTGGCGG TCTTCGCCAC GGTCTTCGGC ACAGCGACCA GCCTCGGGCT CGGCGCGCTC 
CAGGTCACCG CGGGCCTGGA CCGGGTCGCC GGGATTCCCG ACAGCACCAC GGCGGAGCTG 
GTGGTGATCG GGGCGTTGAC CCTGGCCTTC GTCGTCTCGG CCTTCTCCGG GCTGTACCGG 
GGCATCAAGT GGCTGTCCAC CACCAACGTG GTGCTGGCGG TGCTGCTGAT GCTGTTCGTC 
TTCGTGGTCG GCCCGACGGT CTACGTCCTG GATGTGCTGC CCGCCTCGAT CGGCGACTAC 
GTCAGCAACC TGGTCTTCAT GTCGACGCGG ACCGGGGCCT TCTCCGACCC GTCCTGGTTG 
GGCTCCTGGA CGATCTTCTA CTGGGCGTGG TGGATCTCCT GGGCCCCGTT CGTCGGTACC 
TTCATCGCCC GCATCTCCCG TGGTCGTACG GTGCGCCAGT TTCTGGTCGG CGTGCTGCTG 
GTGCCCAGCG GGGCCAGTGT GGTCTGGTTC GCGGTGATGG GCGGCAGCGC GCTGCGGGTG 
CAGGCCACCG GCACCCGGGA CCTGGTCGCC GAGGCCGCCG CCGGCGCCGA CCAGGCACTC 
TTCGGGTTGC TCGACGCGTT GCCGCTGGGC GCGCTGACCA GTGTGCTGGC CATGGCGCTG 
GTGATGCTCT ACTTCGTCAC CAGTGCCGAC TCCGCCTCCC TCGTGCTCGC GTCGCTGACC 
TCCCGGGGCG CGTTGCGTCC GCGCCGGTTG CTCGTCGTCA CCTGGGGTGT GTTGATCGGT 
GGGACCGCCG CGGTGCTGCT GCTGGCCGGC GGGCTGAACG CGCTCCAGCA GGCGACGATC 
ATGGTCGCGT TGCCGTTCGT GGTGGTGATG CTCGGCCTGG CCGTGTCGTT GGTCAAGGAG 
ATGTCCCAGG ACCCGGCGGT GCGGGTCCCC CCGCCCCAAC CGCACGGGCT GGCCGCCGCC 
CTCCACCGGG CCCGCTCGAC CGAGGAGGAA CACTAG

Protein sequence

MDMGGSAGRP GSGSVDRLLL CLAVGGVLAV VAWGVLDRES VSAVGQTGLN WVITTFGWLF 
VVAANAFLVL AVVLALSRFG TIRLGPDAER PEFSTLAWVA MMFSAGMGIG LVFFAVAEPI 
QHYASPPPAT GVEPETGAAA SAAMQFTLFH WTLHPWAIYA VVALALAYST FRKGRENRIS 
AVFRPVLGDR ADGAAGRVID LLAVFATVFG TATSLGLGAL QVTAGLDRVA GIPDSTTAEL 
VVIGALTLAF VVSAFSGLYR GIKWLSTTNV VLAVLLMLFV FVVGPTVYVL DVLPASIGDY 
VSNLVFMSTR TGAFSDPSWL GSWTIFYWAW WISWAPFVGT FIARISRGRT VRQFLVGVLL 
VPSGASVVWF AVMGGSALRV QATGTRDLVA EAAAGADQAL FGLLDALPLG ALTSVLAMAL 
VMLYFVTSAD SASLVLASLT SRGALRPRRL LVVTWGVLIG GTAAVLLLAG GLNALQQATI 
MVALPFVVVM LGLAVSLVKE MSQDPAVRVP PPQPHGLAAA LHRARSTEEE H