Gene Hhal_1839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1839
Symbol
ID	4711380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2011853
End bp	2012983
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	71%
IMG OID	639856310
Product	hypothetical protein
Protein accession	YP_001003405
Protein GI	121998618
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0767] ABC-type transport system involved in resistance to organic solvents, permease component
TIGRFAM ID	[TIGR00056] conserved hypothetical integral membrane protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCTGATC CGGGCCACCT GGAGTGCCGG GCGGGCGCGG CGGCCCCCGA GGTGCGTATC 
CGCGGAGACT GGACCCTGGC CCACTACCGC ACGCTCCTGC GGCAGGTGGA GCAGACCCGC 
CTGGGCGGCG AGCCGCGCGT CGACCTCAGC GCCCTGGGCC GGCTCGACAC CGCCGGGGCG 
ACGCTACTCG CCCGCCTGCT CGGAGCAGCC CGCGTCGAGG CCCTGGCGCG CTCCACGCCG 
GAGCTCTCCG CCGAGCGGCG CAAGCTGCTC CAGGCGGTCG CCGCCGCCAG CGAGCGCGCC 
CGCACCGCAC CGGAACCGCG CGGCGATCCC TACTTCCTCG GTCAGCTCAC CATCGGCCTG 
GGGGCACAGA TGACCCACGC AGGCCATCAG CTGGCCCGGG CCATCGGTTT CACCGGCCTG 
GTCATCGCGG CATTCGCCGC CGGCCTGTTG CGCCCCTGGC GCTGGCGCCT GGCCGCCGTC 
TCCCGGCAGC TCCAGCACAC CGCCCTGGAG GCGCTGCCCA TCGTCGCCCT GCTGACTTTC 
GCGGTGGGGG CCGTCATCGC CGTCCTCGGG GTCACCGTAC TGGGCCGCTT CGGCGCCGGC 
ATCTTCACGG TGGACCTGGT GGCCTACGCC TTCCTGCGCG AATTCGGCGT GGTCCTCACG 
GCGATCCTCC TCGCCGGACG CTCGGCCAGC GCCTTCACGG CGCAGATCGG CTCGATGAAG 
GCCAACGAGG AGCTCGACGC CATGCGCGCC CAGGGATTCA GCCCCATCGA GATGCTGGTC 
ATCCCGCGGG TCGTGGCACT ACTGATCGCC GTGCCACTGC TCTCCTTCGT GGCCGTGGTC 
TGCGGCCTGG CCGGCGGTGG ACTGGTCACC CTGCTCAACG TCGACGTCCC GGCGGGGCGG 
ATCATAGCCC TCTACAGCGA CATCTCCGTC AGCCACTACC TGGCTGGACT GGCCAAGGCA 
CCGATCTTCG CCTTCGTCAT CGCCATCATT GGCTGCCTGG AGGGGATCAA GTGCAGCGCC 
AGCGCCCAGT CGGTGGGCAC GCACACGACC TCCGCGGTGG TCCAGTCGAT CTTCTGGGTC 
ATCATCCTCA ACGCTGTGGC CGCCCTGATC TACGTGGAGC TGGGATGGTG A

Protein sequence

MADPGHLECR AGAAAPEVRI RGDWTLAHYR TLLRQVEQTR LGGEPRVDLS ALGRLDTAGA 
TLLARLLGAA RVEALARSTP ELSAERRKLL QAVAAASERA RTAPEPRGDP YFLGQLTIGL 
GAQMTHAGHQ LARAIGFTGL VIAAFAAGLL RPWRWRLAAV SRQLQHTALE ALPIVALLTF 
AVGAVIAVLG VTVLGRFGAG IFTVDLVAYA FLREFGVVLT AILLAGRSAS AFTAQIGSMK 
ANEELDAMRA QGFSPIEMLV IPRVVALLIA VPLLSFVAVV CGLAGGGLVT LLNVDVPAGR 
IIALYSDISV SHYLAGLAKA PIFAFVIAII GCLEGIKCSA SAQSVGTHTT SAVVQSIFWV 
IILNAVAALI YVELGW