Gene Csal_0223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0223
Symbol
ID	4027306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	249948
End bp	252008
Gene Length	2061 bp
Protein Length	686 aa
Translation table	11
GC content	62%
IMG OID	637965374
Product	choline transport protein BetT
Protein accession	YP_572286
Protein GI	92112358
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACAC AATCCAATAA CGAGGCACCG ACACGCGATC GCCTCAATGG GCCGGTGTTC 
TATAGCTCGG TGATCGGCAT CGTCGCCTTC TCGCTGTGGA CCATGGTCGC TACCGACCAG 
GCCAATACCA TCATCAATGC CATACTCGGC TGGATCTCCA ACACCTTCGG CTGGTACTAC 
TTCCTGACCG TCGTGATCTA CCTGGTCTTC GTGATCTATC TGGGGGTCTC GCGCTACGGC 
AGCATCCGAC TGGGGCCAGA GCATTCGCGC CCCGACTTCA ATATCTTCTC GTGGTCGGCG 
ATGCTGTTCT CCGCGGGGAT CGGCATCGGC GTGATCTTCT TCGCGCTGGC CGAGCCGTTG 
ACGCAGTTCT ACAACGCGCC CGACGCGCCC GAGGATCAGG TCGCCGCGGC ACGCCACGCC 
ATGGAACTGA CCTTTCTGCA CTGGGGGCTT TCCGGCTGGG GCATCTACAC CCTGGTGGGC 
ATGGCGCTGG CCTTCTTCAG CTATCGGCAC AACCTGCCGC TGACCATCCG CAGCGCGCTC 
TACCCGATCT TCGGCGAGCG GATCTACGGC ATGATCGGCC ACGTGGTCGA CACCGCTGCC 
GTGCTGGGCA CGGTATTCGG CATCGCGGCC AGCCTGGGGA TCGGGGTCAT CCAGCTCAAC 
TTCGGCCTGG ACTACATGTT CGGCATTCCC AAGGGTACCT GGACCCAGGT GGTGCTGGTG 
CTGGGCATCG TGCTGTTCGC GACCATTTCC GCCGTGACCG GGGTGGAACG CGGCATCCGC 
CGTCTTTCCG AGTTCAATAT CCTGCTCGCG GTCCTGCTGC TGCTGTTCGT GCTGTTTGCC 
GGCAAGACGA TCTTTTTGCT CAACGCGCTG GTGATGAACA TCGGCGACTA CCTGACCAAC 
TTCGTCAGCC TGTCGTTCAA CACCTATGCC TTCGACCGGC CGACCGGCTG GTTGAACGGC 
TGGACGCTGT TCTTCTGGGC CTGGTGGATC GCGTGGGGGC CGTTCGTCGG GCTGTTCCTG 
GCGCGCATCT CGCGGGGCCG GACGATCCGC ACCTTCGTGC TCGGCACCAT GACGCTGCCG 
ATCATCTTCA TGTTCCTGTG GATGTCGCTG CTGGGTAACA GTGCCATCGA CATGGCGATG 
AACGGCGCCA GCGAGTTCGG CGAGCAGGTG ATGAACAACC CGCCGGCGGG GATCTATCTG 
TTCCTCGAAT CGTATCCGAT GCCGCTTTTG ACCACCGCGG CGGTGAGCAT CCTGGCGATC 
GTGTTCTTCA TCACCTCGGG GGATTCCGGG GCGCTGGTTC TCTCGAACTT CACCTCGAAG 
CTCAAGAACG TCAACAGCGA TGCGCCGGTC TGGATGCGTA TTCTGTGGTC GGCGGTGATC 
GGCATCCTGA CCCTGTCGCT GCTGCTCGCC GGGGGGCTGA CCACCTTGCA GAGCGCGGTG 
GTGATCACCG GACTGCCATT CTCGATCGTG CTGTTCTTCA TGATGGCGGG GCTGCTCAAG 
GCACTGAAGC TCGAGGCCTT CAAGGAAGAC AGCCGGCGCC TGAGCCTGGC CGGCCAGCTT 
TCCGGTCGTA CCGGTGGCGG CGAGCGCGAC TCCCGCAATT GGCAGCAGCG CCTTCGTCGT 
GCCATGAGCT TCCCCGGCAA GAAGCAGGCA CGGCGCTTCA TGGAGGAAAC CTGCAAGCCC 
GCCATGGAAG CCGTGCGCGA CTCGCTGCAG GAGCAAGGCG TGTCCGTCGA GATCAATCAG 
GGCGTGCAGA ACGGCGACGA CTACCTGTCG CTCAACGTCG ATTTCGAGGA CGAGCAGAAC 
TTCACCTACC AGGTCTGGAG TCAGGGCTTC TCGACGCCCG GATTCGCGAT GCATGCCCCG 
CATGCCGACT CGCGCTACTA CCGGCTGGAG GTCTACCTGC TCGAGGGTAG CCAGGGTTAC 
GACCTGATGG GCTACACCCG CGATCAGGTG ATCGGCGACA TCCTCGACCA GTACGAACTG 
CACATGCAGT TCCTGCACCT CAACCGGATA GAGCCGGGCA ACATCAACAT GCCCGACAGC 
CCGGAACAGC CGCCTTCATA A

Protein sequence

MTTQSNNEAP TRDRLNGPVF YSSVIGIVAF SLWTMVATDQ ANTIINAILG WISNTFGWYY 
FLTVVIYLVF VIYLGVSRYG SIRLGPEHSR PDFNIFSWSA MLFSAGIGIG VIFFALAEPL 
TQFYNAPDAP EDQVAAARHA MELTFLHWGL SGWGIYTLVG MALAFFSYRH NLPLTIRSAL 
YPIFGERIYG MIGHVVDTAA VLGTVFGIAA SLGIGVIQLN FGLDYMFGIP KGTWTQVVLV 
LGIVLFATIS AVTGVERGIR RLSEFNILLA VLLLLFVLFA GKTIFLLNAL VMNIGDYLTN 
FVSLSFNTYA FDRPTGWLNG WTLFFWAWWI AWGPFVGLFL ARISRGRTIR TFVLGTMTLP 
IIFMFLWMSL LGNSAIDMAM NGASEFGEQV MNNPPAGIYL FLESYPMPLL TTAAVSILAI 
VFFITSGDSG ALVLSNFTSK LKNVNSDAPV WMRILWSAVI GILTLSLLLA GGLTTLQSAV 
VITGLPFSIV LFFMMAGLLK ALKLEAFKED SRRLSLAGQL SGRTGGGERD SRNWQQRLRR 
AMSFPGKKQA RRFMEETCKP AMEAVRDSLQ EQGVSVEINQ GVQNGDDYLS LNVDFEDEQN 
FTYQVWSQGF STPGFAMHAP HADSRYYRLE VYLLEGSQGY DLMGYTRDQV IGDILDQYEL 
HMQFLHLNRI EPGNINMPDS PEQPPS