Gene Hhal_0303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_0303
Symbol
ID	4711213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	340346
End bp	341707
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	70%
IMG OID	639854763
Product	tetratricopeptide TPR_4
Protein accession	YP_001001899
Protein GI	121997112
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGACGGC TGGGTATGAT CAAACGCACC GGGCTCTGCG CCCTCTACCT TGCGCTCGGC 
CCCGGTCTGG CAACCGCGGA GCCCCCGTCC CAGCCTACAA AGGTTGAGAT CAATCCGGAC 
CGGGTCGCCT TGGAGATCCG GCGGGAACTC GATGCCGACC GCCCCGGGCA GGCCCTCACC 
CTGGCCCGAA CCCACAAGGA ACTCGCCGGA TACCCCATCT ACGACTTCGA GGCCGGGCGC 
GCCTACCTGC GCAGCGGGGA TATCGACGAG GCGGTGGTGC ACTTCGACCG GGCCGTCATG 
GTCGCCCCGG ATGTGCCGCG CTACCGTCTG GAGTACGCCC GCGCGCTGTT CGCGGCCGAG 
GATCACGAGG CCTCTCAGCG TCAGTTTCAG CGCGTGCTGG ATACCGATGT ACCGGAGCCG 
GTGGCCCAGA ACATCCGCCG CTTCCTGGAG GTCATTGACG CCCGGCTCGC CTCTCGCCGC 
CCGGAGACCC GACTGGAGGT CGCCGCCGCC GCTGGCTACG ACTCCAACCC GCTCTCGGCG 
GCGGACGACG AGTTCCTGCT CTTCGGCGTC TTCCCGCAGA CCTTCGAGCG CGAGTCCGAT 
ACCTTCCTCG ACACCCGCGC GCAGCTGGAA CACCGCCGCC CCCGCACCCG GAGCAGCAGC 
TACCACTACC GTGGCGAGGT GGAGCACCGC CGCCACAGCG ACGTCAGCGC CGCCGACCAG 
ACCCAAGCGC GCCTGCGCGG CGGGTTGTCG TTCGAGGGGG CACAGGGCCG CTCCTACCGC 
CTGCCGGTGG AGGTGCAACA CACCCGCCTG GACGGCGAGA CCTTCCGCAC CCGCGTCGCC 
TTCCTGCCCC AGGCGGTGCT CCCCGGGGCC CCGGACCGCC AACTGCGCCT GCAGGGCCAG 
CTGGCCTACG CCGATTACGA CAACGACGAC CGCGACGCCG TCACCCTCGG CGCCTCCGCC 
ACCTCGCTGC ACGTCCTCAA CCCGGATAGC GGGCTCTTGC TCTACACCGG CCTGGCGGCC 
TCCTATGAGG ACGCCGACGC CGACGCGTTC ACCACCACCC GCGCCGGCGC ATTCGTAGGC 
GCCCAACGGG ACCTGTTCCA GGACGCCACC GCCAGCGTCA CGCTCACCGC CTCCCACGAG 
CGGGCCCGCG AGGCGCGCGC GATCCTCGGC CTCTTCCCGG AGGAGGACAA CACCGCCGAG 
CGGGCCACGA CGTTCGAGCT CCGCGGGGCC CTGGCCCACC CGCTGTGGGA CTCCGGATTC 
ACCGGCTTCG CCGAGGGCGC CCTGCGCGAG AAGCGCTCCA ACATCGACCT GTTCGAGTTC 
ACCCAGCGTG AGATCTTCGC CGGAGTGCGC TATGACTACT GA

Protein sequence

MGRLGMIKRT GLCALYLALG PGLATAEPPS QPTKVEINPD RVALEIRREL DADRPGQALT 
LARTHKELAG YPIYDFEAGR AYLRSGDIDE AVVHFDRAVM VAPDVPRYRL EYARALFAAE 
DHEASQRQFQ RVLDTDVPEP VAQNIRRFLE VIDARLASRR PETRLEVAAA AGYDSNPLSA 
ADDEFLLFGV FPQTFERESD TFLDTRAQLE HRRPRTRSSS YHYRGEVEHR RHSDVSAADQ 
TQARLRGGLS FEGAQGRSYR LPVEVQHTRL DGETFRTRVA FLPQAVLPGA PDRQLRLQGQ 
LAYADYDNDD RDAVTLGASA TSLHVLNPDS GLLLYTGLAA SYEDADADAF TTTRAGAFVG 
AQRDLFQDAT ASVTLTASHE RAREARAILG LFPEEDNTAE RATTFELRGA LAHPLWDSGF 
TGFAEGALRE KRSNIDLFEF TQREIFAGVR YDY