Gene Hore_21510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_21510
Symbol
ID	7313389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	2340341
End bp	2341534
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	42%
IMG OID	643612603
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_002509891
Protein GI	220932983
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4175] ABC-type proline/glycine betaine transport system, ATPase component
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	87
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAAA TTCAAGTTAA AAACCTGTAT AAAATATTCG GCCCAAAGCC CCATAGAGTC 
TTTCCTCTCC TGGAAAAAGG ACTATCAAAA GAGGAAATCC TTGAAAAAAC GGGCCACACT 
ATTGCTGTAA ATAATGCCAG TTTTTCTGTG GAAAAAGGTG AAATATTTGT AGTCATGGGA 
TTATCGGGGA GTGGCAAATC AACCCTGGTC AGGTGTATTA ACCGTTTAAT TGAGCCAACG 
AGAGGTCAGA TTATAGTTGA TGAAGATGAG GTAACCGGTG CTGATATGGA AAAATTACGT 
GAAATAAGAA GACATAAAAT AGGAATGGTC TTTCAGCATT TTGCTCTCTT TCCTCATCGG 
ACTGTTTTAG AAAATGTGGA ATATGGTCTA GAAGTTCAGG GTGTTCCTGA AGAGGAAAGG 
AGAGAACAGT CATTAAAAGC CCTTGTTCAG GTGGGACTGG AAGAATGGGC TTCCTATAAT 
CCTGGTGATT TGAGTGGGGG TATGCAGCAG AGGGTTGGAC TGGCCCGGGC CCTGGCTACC 
GATCCGGATA TTCTTTTGAT GGATGAAGCT TTTAGTGCCC TTGACCCCCT GATAAGACGG 
GATATGCAAA ATGAACTCCT GGACTTACAG GCCAAACTCC ATAAAACAAT AGTATTTATT 
ACCCATGACC TCGATGAAGC TCTGAGAATG GGTGATAGAA TTGCCATTAT GAAAGATGGC 
CAGATAGTCC AGACTGGAAG TCCAGAAGAG ATTCTCTCTG AGCCTGCCAA TGATTATGTG 
GCCAATTTTG TCAGGGATGT AAATAAGTTA AAGGTATTAA AAGCTGAGGA TGTGATGATC 
AGACCTGATG CCCTGATTCA TGCTCAGGAT GGGCCCAGAA TGGCCCTGAG GATTATGGAT 
GAAGAGGGTT TTAACAGTGT TTATGTTGTT GACCATGACA AACGTGTAGT GGGCATAATT 
GAAGATGATA AAGCCCTTGA AGCCCGGAAA AAGGGAGAGA CTAATTTAAA AGATTATCTG 
ATAACTGATT TTCCTAAAGC CACTCCGGAT ACACCACTTA CTGAGCTTCT GCCAATAGCT 
TCAGAAACTA AATATCCTGT TGCTGTCGTA AATGATGATA ATCGTTTAAC TGGAATAATA 
GTCAGGATTT CAGTCTTATC TGCCCTGGCA GAAGGAGGGG AAGAAGATGT TTAG

Protein sequence

MAKIQVKNLY KIFGPKPHRV FPLLEKGLSK EEILEKTGHT IAVNNASFSV EKGEIFVVMG 
LSGSGKSTLV RCINRLIEPT RGQIIVDEDE VTGADMEKLR EIRRHKIGMV FQHFALFPHR 
TVLENVEYGL EVQGVPEEER REQSLKALVQ VGLEEWASYN PGDLSGGMQQ RVGLARALAT 
DPDILLMDEA FSALDPLIRR DMQNELLDLQ AKLHKTIVFI THDLDEALRM GDRIAIMKDG 
QIVQTGSPEE ILSEPANDYV ANFVRDVNKL KVLKAEDVMI RPDALIHAQD GPRMALRIMD 
EEGFNSVYVV DHDKRVVGII EDDKALEARK KGETNLKDYL ITDFPKATPD TPLTELLPIA 
SETKYPVAVV NDDNRLTGII VRISVLSALA EGGEEDV