Gene Hore_18440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_18440
Symbol
ID	7313842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1969187
End bp	1970320
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	41%
IMG OID	643612291
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_002509588
Protein GI	220932680
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.00065366
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAGAC TGGAAGGTAT AAGTAAAGTT TATCCCAATA TGGACAGACC TGCTGTTAAG 
GAATTGAATT TACATATTGA GGAAGGGGAA ATATGTATTC TGGTTGGTCC CTCAGGATGT 
GGTAAAACTA CTACTCTAAA AATTATTAAT CGTCTTATTG AACCTTCTTC AGGAAAAATA 
TATATAAACG GGAAAGACGC CATGAAAGAA GACCCCAATG AATTAAGGCA AAATATTGGT 
TATGTCATCC AGCAGATTGG CCTCTTTCCT CACATGACAG TTTATGAAAA TATTGCTACT 
GTACCAAGAC TCCGGGACTG GGATGAAGGC CGGATCCGGA AAAGAGTTGA TGAGCTTTTA 
GAGATGGTGG AACTCGATCC GGAAGAAAAC CGTTATAAAT ATCCCATGGA GTTATCCGGT 
GGACAACGGC AGAGGGTCGG GGTAGCCCGG GCTATGGCGA TAGACCCACC TATTATGTTA 
ATGGACGAGC CCTTTGGAGC AGTTGATCCC ATAACCCGGA CCCAGCTTCA GAACGAGTTT 
TTAAAACTGC AGCGCAAGAT AAAAAAGACC ATAGTTTTTG TTACTCATGA TATAGATGAG 
GCCATTAAAA TGGGAGATAA AATAGCTATT ATGAATCAGG GTGAACTTGT TCAGTTTGAC 
ACCCCGGCCA ACATTTTATT CAACCCCGGG AATGAATTTG TCGAAGACTT TGTTGGTTCT 
GACAGGGGCC TTAAGGTCCT TAATTTAATA CATGTTGACA AAATAATGAA TACCGGTGTT 
CCTACCGTAG AGAGTGTTTC CCGGGCTGAG GATGTTTTAA AGGAGATTAA TAACCTGGAT 
CAGGATTATA TCATGGTCAC CGGTGAAGAT GAACACCTGG CCGGTTATAT AAGCAGCAAT 
AGATTGAAAA AACATCAGGA TTCCGACTGG TATAAATTTT TGAAACCGAC CCCGGTTGTC 
GAAATAGAGG CAACTTTAAA GGATGCCCTG GCTAAAATGA TCGAAAATGA TGTGGCTGTA 
GTCCCGGTTG TAAATGATGA GCGGGAACTG GTCGGAACTG TTACTTTAAA AGATATTAGG 
TCTTATGTCA GCAATTCCTA TCAGGAAAAT GATTTAGTGT CAGTTAATAT ATAA

Protein sequence

MIRLEGISKV YPNMDRPAVK ELNLHIEEGE ICILVGPSGC GKTTTLKIIN RLIEPSSGKI 
YINGKDAMKE DPNELRQNIG YVIQQIGLFP HMTVYENIAT VPRLRDWDEG RIRKRVDELL 
EMVELDPEEN RYKYPMELSG GQRQRVGVAR AMAIDPPIML MDEPFGAVDP ITRTQLQNEF 
LKLQRKIKKT IVFVTHDIDE AIKMGDKIAI MNQGELVQFD TPANILFNPG NEFVEDFVGS 
DRGLKVLNLI HVDKIMNTGV PTVESVSRAE DVLKEINNLD QDYIMVTGED EHLAGYISSN 
RLKKHQDSDW YKFLKPTPVV EIEATLKDAL AKMIENDVAV VPVVNDEREL VGTVTLKDIR 
SYVSNSYQEN DLVSVNI