Gene Hhal_1831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1831
Symbol
ID	4709273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	2002414
End bp	2003739
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	70%
IMG OID	639856302
Product	tetratricopeptide TPR_4
Protein accession	YP_001003397
Protein GI	121998610
COG category	[S] Function unknown
COG ID	[COG3014] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGTCTG GACTGCGTTG GTCCGGGCTG GCGGTGGCGC TGGCCATCGC GTTGGCCGGG 
TGCACGACGT ACGGTGACCG AATGGGCCCG GTGGAGGCCG CGGTCGACGA GGGGGACCCG 
CGCCGGGCAG TGGAACTCCT CGATGAGCGC AGCGGCGGCT CCGGGGACCG GGTGGTGGAC 
CTGCTCAACC GGGGCGCGCT GCTGCGCATG GCCGGCGAGT TCGAGGCGAG CAATCGTGCC 
CTGGAGGCGG CCTATGACGC CATTGCCGAG GTCGACCCGC TGAGTGTCTC CGAGAGCGTT 
GGAAGCCTGA TGGTGGGCGA GACGGTCTTT GCCTATGCCG GCGAGCCCCA CGAACGGGTG 
CTGCTCCATC TGCTCATGGC CTTCAATTAT CTGGATCTGG GTGACCCCGA CGCCGCCCGG 
GTGGAGGCCC TGCGGGTGGA TCTGCGTCTG CAGCGCCTGG CTGCCGAGCA GGGCCGGTCC 
GTCTACCGGC AGGACCCCTT CGCGCGGTAT CTCAGCGGGC TGATCTTCGA GCGTCTCGGC 
GAGCCGGATC AGGCCCTGGT GGCGTATCGC CAGGCCTACC AGGCGTACCG GGAGCAGGGC 
GGCCGCCTGG GCGTCGCCGT GCCCCAGGCG CTGCACCGGG ATCTGCTGCG TCTGGCTGAT 
GAACTGGGTC TCGACGACGA CCGGGCCGAG TGGCAGGAGG CGTTCGGGAA GGACACCTGG 
CCGGATCCGG CCGCGCATCG CGAGCAGGCC CATGTGGTGA TCGTCGCCGG GGTCGGATTG 
GCGCCGCGTA AGGGCGAACA AGGGTTCGCG GTGCAGGACC ATCAGGGGCG CATCCACAGC 
GTGGCCCTGC CGTATTACGA GCCGCGGCAG CGGCCGGTTG GGGGCATCCG GGTCAGCAGC 
GAGGCGGCCT CGGTCGTGGC AGAGCCGGTG CACGATATCG ATGCGGTCGC CCGTATCCTG 
CTCCAGGAGC AGCAGGCCGC GCTGGCTGCC CGGGCGCTGG GCCGGCTGTT GGTGCAGAAG 
GAGATGATCG ATCAGGCCCG GGAAGCCAGT CCGGTAGCCG GCCTGGCTAT GAACATCTTT 
ACCCTGGTCG CCGACCGCGC AGATACCCGG ACCTGGGGGA TGCTGCCGGC GCAGTACTAC 
ATGGCCCGGA TCAGCCTGCC GCCCGGTGAG CACCGGCTCG AGCTGGTCTA TCAGGGGCGC 
TCCGGGCACG CCCTGACCCG GGTGGATCTG GGGCCTCTGG AGCTTGAGGC CGGGGAGTAC 
CACTTTGTCT TTGATCGCTG GGTTTCGGCG CATGCTGGCT CCGTAACTCG CAGGGAGGAG 
CCGTGA

Protein sequence

MRSGLRWSGL AVALAIALAG CTTYGDRMGP VEAAVDEGDP RRAVELLDER SGGSGDRVVD 
LLNRGALLRM AGEFEASNRA LEAAYDAIAE VDPLSVSESV GSLMVGETVF AYAGEPHERV 
LLHLLMAFNY LDLGDPDAAR VEALRVDLRL QRLAAEQGRS VYRQDPFARY LSGLIFERLG 
EPDQALVAYR QAYQAYREQG GRLGVAVPQA LHRDLLRLAD ELGLDDDRAE WQEAFGKDTW 
PDPAAHREQA HVVIVAGVGL APRKGEQGFA VQDHQGRIHS VALPYYEPRQ RPVGGIRVSS 
EAASVVAEPV HDIDAVARIL LQEQQAALAA RALGRLLVQK EMIDQAREAS PVAGLAMNIF 
TLVADRADTR TWGMLPAQYY MARISLPPGE HRLELVYQGR SGHALTRVDL GPLELEAGEY 
HFVFDRWVSA HAGSVTRREE P