Gene Csal_0654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0654
Symbol
ID	4026339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	732371
End bp	734005
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	62%
IMG OID	637965824
Product	choline/carnitine/betaine transport
Protein accession	YP_572714
Protein GI	92112786
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAACA ATGGAAGGCA ACGCGTATTT ATCGTCTCCG CCTTGATCGT CGCGGTTCTC 
GTCGCCATCG GGGCGGCGTT TCCCGAGCGT TTCGGCAGCG CGGCGTCGTC GGCATTATCC 
GGCATTTCGC ACTATTTCGG GTGGTTCTAC CTGTTTTCGG TGTTCGGGTT CGTGGTGTTC 
TTGCTGACGC TGGCGTGCAG CAAGTATGGC AAGATTCGGC TCGGCCCCCA GGACAGTTCG 
CCCTCCTACA GTTTCTTCTC GTGGGTCAGC ATGCTGCTGG CGGCGGGGTT CGGCGTCGGC 
CTGGTGTTCT ACGGCATGGC CGAGCCGATG ACGCACTTCC TCGAACCGCC CTACGGTGAT 
GTGGAAGGCG GTACCGAAGA GGCGGCACGC TATGCCATCC AATACAGCTT CTTCAACTGG 
GGCATTCATC AGTGGGCCGC GTTTTCCGTG GTGGGGCTGA TCATTGCCTA TTATCAGTTC 
CGCAAGGGCC AGGCGGGGCT GGTCTCCAAC GTGCTTTCGA GCATGACCGC CAAGCGTCCC 
AAGATGCGCA AGCTGGGACC GGCGCTGGAT GTCTTTGCCG TGGTCGCGAC GGTGATGGGG 
GTGGCGACCT CCATCGGTCT GGCGGTGCTG CAGATCAACG GCGGCCTGCA TGCGGTCTTC 
GGTGTCGAAG AGGGCATGAC GTGGCAGTTC ATCATCATGG GGGCGATGTT TTTGTGTTAC 
ATGGCCTCCA CCTGGTCGGG GCTGGACAAG GGCATCAAGC GCCTTTCCAA CCTCAACATG 
GCGCTGTGCT TCGCGTTGAT GTTCTACGTG CTGTTCACGG GCCCCACCGT GGCCATTCTC 
GAGACCATCA CCCTGGGGAT CGGCGATTAC CTGCAGAACA TCGTGGGCAT GAGCCTGCGG 
GTCGCGCCGT ATAGCGACAA CACCTGGGCC AGCAACTGGA CGATCTTCTA TTGGGCCTGG 
GTCATCGCCT GGTCGCCGTT CGTGGGCACC TTCGTGGCGC GCGTCTCGCG TGGGCGCACC 
ATCAAGGAGT ACGTGTTCGG CGTGTTGATC GTGCCGCCGC TGCTGGCCTG CCTGTGGATC 
GGGGTCTTCG GCGGCGCGGC GCTCAACATG GAGCTCACCG GCGACGTGGG ACTGGCCTCG 
GCCACGGCAG ACAACATCAC GGTGGCGCTG TTCCGGATGT TCGAGCTGAT GCCGTTCTCC 
AATGTGCTGT CGGTGGTGGC GCTGTCGCTG ATCTTCATTT TCCTGGTGAC CTCGGCGGAC 
TCGGCGACCT ATATCGTGTC GCAGATGACC GATGGCGGTT CGCTGAATCC GCCGCTGTTC 
AAGCGGGTGA TCTGGGGGGT ACTGATCGCG GCGATCTGTC TGACCCTGCT GATTGCCGGC 
GGGTTGAATG GCCTGCAATC GGCGGCGGTG CTGGCGGCGT TACCCTTCAC CTTCATCCTG 
TACGGCATGA TTGCCGTGCT GGTGAAGGAA TTGCGCGCCG ATCGCAAGGC GATGCTGACA 
TCGCTTTATC ATCGTCATGG GGAAACGCCG GTAGGCGCCG ATGCCTTCGA GGCGGAAACG 
CTGGCGGAAG CCGAGCGGTA CCGGCGTGCA CCGAACGTGG TCAACCGGCG CATCAATACG 
CGCGACGGTA CCTGA

Protein sequence

MANNGRQRVF IVSALIVAVL VAIGAAFPER FGSAASSALS GISHYFGWFY LFSVFGFVVF 
LLTLACSKYG KIRLGPQDSS PSYSFFSWVS MLLAAGFGVG LVFYGMAEPM THFLEPPYGD 
VEGGTEEAAR YAIQYSFFNW GIHQWAAFSV VGLIIAYYQF RKGQAGLVSN VLSSMTAKRP 
KMRKLGPALD VFAVVATVMG VATSIGLAVL QINGGLHAVF GVEEGMTWQF IIMGAMFLCY 
MASTWSGLDK GIKRLSNLNM ALCFALMFYV LFTGPTVAIL ETITLGIGDY LQNIVGMSLR 
VAPYSDNTWA SNWTIFYWAW VIAWSPFVGT FVARVSRGRT IKEYVFGVLI VPPLLACLWI 
GVFGGAALNM ELTGDVGLAS ATADNITVAL FRMFELMPFS NVLSVVALSL IFIFLVTSAD 
SATYIVSQMT DGGSLNPPLF KRVIWGVLIA AICLTLLIAG GLNGLQSAAV LAALPFTFIL 
YGMIAVLVKE LRADRKAMLT SLYHRHGETP VGADAFEAET LAEAERYRRA PNVVNRRINT 
RDGT