Gene Csal_1517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1517
Symbol
ID	4029213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1725863
End bp	1726813
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	63%
IMG OID	637966700
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_573569
Protein GI	92113641
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00127851
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAACA AGACGTCTTT GATCGCGCTG CTGGGCGCCA CTACATTGCT TTCACCCCTG 
GCCATGGCAA ATACGCCGGA AAGCTGCCAG CCGGTACGCT TCGCCGAAGT CGGCTGGACC 
GACATCACCG CCACCACCGC CTTGACCCGT GAGGTGCTCG AGGGCCTCGG TTACGAGACG 
ACGTCCAACA CCGTCTCCGT GCCGGTGGCC TACGCCGGGA TGAAGAACGG CGACTTCGAC 
GTGTTCCTGG GCAACTGGAT GCCGTCGATG GCCTCGATCA GCGACGAGTA TATCGACAAG 
GGACAGGTGG ATCGTCTCGG CGCCAACCTG GAGGGGGCCA AGTACACCCT GGCGGTGCCG 
CAGTACGTCT ACGATGCCGG CGTGACCTCG GTCGAAGACC TGGACGCGCA TGCGGACAAG 
TTCGATAGCC GCCTGTACGG CATCGAAGCG GGCAACGACG GCAATCAGAT CATCCAGCAG 
ATGATCGATG ACGATGCCTT CGGGCTGGGC GACTGGAGCC TGATCGACTC GTCCGAATCG 
GGCATGCTCG CCGAACTCAA CTCCCGCACC CAGAGCGAGG AATGGATGGT GTTCCTGGGG 
TGGGAGCCGC ACCCGATGAA CACCAACTAC GAAATGGCCT ATCTGGAAGG CGCCGATGAC 
TACTTCGGTC CCAACCTCGG CGGCGCGACC GTGTATACCA ACACGCGTGC CGGGTACGCA 
GAGGCCTGCG GTAACGTGGG CGAGCTGCTC AACAACCTGA GCTTCACGCT GTCCATGGAA 
AACGAGATCA TGGGCGCCAT CATGGACGAC GGCGAGGATC CGCGCGATGC GGCGCGCACC 
TGGCTGCAGA ACAACCCGTC CGTCCTCGAT GAGTGGCTCC AGGGCGTGAC CACCGTCGAA 
GGCGAGCCCG GGCTGGCGGC CGTGAAGAAA GCGCTGGACA TCGACAGCTG A

Protein sequence

MSNKTSLIAL LGATTLLSPL AMANTPESCQ PVRFAEVGWT DITATTALTR EVLEGLGYET 
TSNTVSVPVA YAGMKNGDFD VFLGNWMPSM ASISDEYIDK GQVDRLGANL EGAKYTLAVP 
QYVYDAGVTS VEDLDAHADK FDSRLYGIEA GNDGNQIIQQ MIDDDAFGLG DWSLIDSSES 
GMLAELNSRT QSEEWMVFLG WEPHPMNTNY EMAYLEGADD YFGPNLGGAT VYTNTRAGYA 
EACGNVGELL NNLSFTLSME NEIMGAIMDD GEDPRDAART WLQNNPSVLD EWLQGVTTVE 
GEPGLAAVKK ALDIDS