Gene Hhal_0237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0237
Symbol
ID	4709928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	272309
End bp	273961
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	67%
IMG OID	639854697
Product	choline/carnitine/betaine transporter
Protein accession	YP_001001833
Protein GI	121997046
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000527978
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGATC CCAACAACAC CGATCCGAAA GAGGTGAAGA AGGAGATCGA GGAGCTGGAG 
CAGGCCTACG AGACCGACCA CGAGATCGGC GATCAGAACA TCAGCACCGA GATCAAGCCC 
ATCGGGCTGG CGCTGGATCT GCACAACCCG GTCTTCATCG TCAGCTCCGC GCTGATCCTC 
GTCTTCCTCA TCGGCACCCT CATCTTCACG GCCCCCGCCC AGGAGGCGCT GGAAGGCGTC 
CGCGGCTGGG CCACCAGCAG CTTCGACTGG TTCTTCCTCA CCGCCGGCAA CATCTTCGTC 
CTCTTCTGCC TGCTGCTGAT CGTCCTGCCC CTGGGCAGCA TCCGCATCGG CGGACAGGAC 
GCGAAGCCGG ACTTCTCGCG ACTGTCCTGG TTCACCATGC TCTTCGCCGC CGGCATGGGC 
ATCGGCCTGA TGTTCTGGGC GGTGGCCGAG CCGGTGGGCT ACTACACCGA GTGGTTCGGC 
TCGCCGTTCA ACATCGAGGG CGGCACCGAC GAGGCGGCCA AGGCGGCCAT GGGTGCGACC 
ATGTACCACT GGGGCCTGCA CCCGTGGGCC ATCTACGGCG TCATGGCGCT GGCCCTGGCC 
TTCTTCACCT ACAACAAGGG GCTGCCGCTG ACCGTGCGCT CGGTCTTCTA CCCCCTCCTG 
GGTGAGCGGG TGTGGGGGCC GCTGGGCCAC ATCATCGACA CCGTGGCGGT GCTGGCCACC 
ATCTTCGGCC TGGCCACCTC CCTGGGCTTC GGCGCCCAAC AGGCGGCCAG CGGCCTGAGC 
TACGTCTTCG AGGCCGTGCC CGATACTCTG GGCACCCAGG TGGCGATCAT CATCGGCGTC 
ACGGTGGCGG CGCTCGTCTC GGTGCTGCGC GGCATCGACG GCGGCATCAA GCTGCTCAGC 
AACCTCAACA TCAGCCTCGC CGGGCTGCTG ATGCTCTTCG TCATCATCGC CGGCGGCGCC 
ATCGCCTTCG TCACCCAGCT CTGGCACACC ACCAGCGCCT ACGCCGGGGA CTTCTTCGCC 
CTCTCCAACC CGGTGGGCCG CGAGGACGAG ACCTTCCTCC AGGGCTGGAC GGCCTTCTAC 
TGGGCGTGGT GGATCAGCTG GTCGCCCTTC GTCGGCATGT TCATCGCCCG GGTCTCCCGC 
GGCCGCACGG TGCGCGAGTT CATGACCGCG GTGCTGATCG TGCCCACGGT GGTGACCATC 
TTCTGGATGA GCGCCTTCGG CGGCGTGGGC CTGCAGCAGG CCATCGAGGG CATCGGTGCC 
CTGGCCGACG GCATCGGCGC CGACGAGTCC ATGGCCCTGT TCCACATGCT GGAGCAGCTG 
CCCTGGACCC TGCTCACCGC CTCGGTGGCG GTCTTCCTGG TGCTGGTCTT CTTCGTGACC 
TCGTCGGACT CCGGCTCGCT GGTGATCGAC AGCATCACCG CCGGCGGCAA GACCGACGCC 
CCGGACGCCC AGCGCGTCTA TTGGGTGGTC ATGGAGGGCC TGATCGCCGG TGTGCTGCTG 
TTCATCGGCG GGGACGCCGC CCTCAGCGCC CTGCAGGCGG GGGCGGTCTC GGCCGGGCTG 
CCGTTCACCG TGGTCCTGCT CCTGGTCTGC CTGAGTCTGC TGATCGGGCT GCGCCACGAG 
CGGCGGCTGA TCAAGCTGAC CCAACAGGCC TGA

Protein sequence

MTDPNNTDPK EVKKEIEELE QAYETDHEIG DQNISTEIKP IGLALDLHNP VFIVSSALIL 
VFLIGTLIFT APAQEALEGV RGWATSSFDW FFLTAGNIFV LFCLLLIVLP LGSIRIGGQD 
AKPDFSRLSW FTMLFAAGMG IGLMFWAVAE PVGYYTEWFG SPFNIEGGTD EAAKAAMGAT 
MYHWGLHPWA IYGVMALALA FFTYNKGLPL TVRSVFYPLL GERVWGPLGH IIDTVAVLAT 
IFGLATSLGF GAQQAASGLS YVFEAVPDTL GTQVAIIIGV TVAALVSVLR GIDGGIKLLS 
NLNISLAGLL MLFVIIAGGA IAFVTQLWHT TSAYAGDFFA LSNPVGREDE TFLQGWTAFY 
WAWWISWSPF VGMFIARVSR GRTVREFMTA VLIVPTVVTI FWMSAFGGVG LQQAIEGIGA 
LADGIGADES MALFHMLEQL PWTLLTASVA VFLVLVFFVT SSDSGSLVID SITAGGKTDA 
PDAQRVYWVV MEGLIAGVLL FIGGDAALSA LQAGAVSAGL PFTVVLLLVC LSLLIGLRHE 
RRLIKLTQQA