Gene Hhal_1646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1646
Symbol
ID	4709938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1797896
End bp	1798861
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	68%
IMG OID	639856111
Product	hypothetical protein
Protein accession	YP_001003212
Protein GI	121998425
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.866595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTGAATC GTGCGCTGCT TTCGGGTCTT GTGGCTGGCA TTTTCTCGGT AAGCCTATGG 
GGCAGTCTGC CGCTATTGCG CCAACTTACC GAGTTGCCGG CCATGATGAC GACGGTGGTG 
GCCCTCGCGG CGGCCGCCGC TGTCGCCTGG TGCTCGGCAA TTTTTGTGCG CGAGCCCCAC 
AGTCGAATGC CGGACCCGGA TCTGAGCTAT TGGCTCGGCG GCGTGCTCTC GCTTGTGGCA 
GCGCTGTACC TCTACTTTGC CGCTCTGGCC TGGGGAGAGC CGGCGCGGGT GACGCTGGTG 
ACGTACCTGT GGCCGGTCGT CTTCGTGCTC GTCGCCAACT GGCTCGCCGG GTGCGGGGTG 
CAGCTGCGGG TGCTTCTCGG GATGGGGGTG GCGTTCATCG GTGTGGCGCC GCTGATCCTC 
GGCGACGCGC CTGCCGGGGC CGAGACGCCG CTGGTGGCCT ACGTCTTTGG GGTGATCAGT 
GGCTGTGCCT GGGCGGCGTT CTCGGTCTAT CTGACCCAGG CGGGTACGAT CCCGTTCCGC 
GGCTACGCAC GCATGTTTGC ACAGGCCGCA GTGATCGCCG TGGTGCTCGC CGTGCTGTTC 
GGCGAGAGCG TCGGTACGCC CCAGAGTACG GACTGGTTGG CGGCTGCGCT GATCGGGGTC 
GGGCCCTACG GCATCGCCTT TATGACCTGG GGGTTTGCCC TGCGTAAGGG GCCCACCGGG 
TTGCTGGGTG TCCTGACCTA CATGGTGCCG GTGATCTCCG CCGTGGTGCT GGTCCTCACC 
GGTTTCACCG AGCCGGAGCT CGCCCTGCTG GTTGCGGGCC TGGCCGTGGT GGGCGGCGCG 
CTGCTGGCCC AGAGTGCCGA GGCTCAGTCC GAGTCCGGCG CCGCCGAGCG AGATCCGGAT 
GCGGTCGAGG ATGCCTCAGC CCGCCGGGCG ATGGACCGGG CCAGCCCCGA GAATATCAGG 
GAGTGA

Protein sequence

MLNRALLSGL VAGIFSVSLW GSLPLLRQLT ELPAMMTTVV ALAAAAAVAW CSAIFVREPH 
SRMPDPDLSY WLGGVLSLVA ALYLYFAALA WGEPARVTLV TYLWPVVFVL VANWLAGCGV 
QLRVLLGMGV AFIGVAPLIL GDAPAGAETP LVAYVFGVIS GCAWAAFSVY LTQAGTIPFR 
GYARMFAQAA VIAVVLAVLF GESVGTPQST DWLAAALIGV GPYGIAFMTW GFALRKGPTG 
LLGVLTYMVP VISAVVLVLT GFTEPELALL VAGLAVVGGA LLAQSAEAQS ESGAAERDPD 
AVEDASARRA MDRASPENIR E