Gene Haur_4082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4082
Symbol
ID	5735941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	-
Start bp	5214544
End bp	5216022
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	47%
IMG OID	641281234
Product	TPR repeat-containing protein
Protein accession	YP_001546842
Protein GI	159900595
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACTG AGGCATTTCA GGCTGGGGTT GCGGCGCTGA AAAGTGGCAA TAAAGCCTTG 
GCCCGCGAAC ATCTGATGAA GGTTGTTGAG CAAGACGAAA CCAACGAACA AGCCTGGCTC 
TATCTGGCGG GGGCATTGGA AGATCCGGCT GAGATGCGAA TTAGTTTAGA AAATGCGCTG 
CACATTAATC CGCAAAGTAA GCGAGCGCAA CAGGGCTTAG AATGGCTGCG CAAGCAACAT 
CCAGCGATTT TTGTTGAGCC AACACCAGCC TTGCCAGCAG CCACAGCACC TGCTTATACT 
GGGGCAACTG TGGCTTTGGC TGATTTGCCA TTAGCTGACA ACCCACTACC AGACCAACCG 
ATCACGCCAA CGCCTTTTCC GGCGACCCAG CCGCTGGGTC AAGCCTCGTT ACCAGCGACC 
CAGCCGCTTG GGAACGGACC GTTGCCTGCA ACCCAGCCAT TGGCTCCCCC AGCCGTAGGC 
GAAGTGCCCG ATGTGTTGCC CTGCCCGCGC TGTGGTGCAC CAACCCGCTA TGTCGAGCAG 
CGTTGTCGCA AATGTGGGAT GAACTTGACG ATCAAAACCG AGCGCCAAAC CCAATCTAAA 
ATACCAATCC TGATTCCTGG CTTATTAAGC CTTCTACCAG CATTATTATG GATATTTCTT 
GCTGGAAACA TTTTTGTAAG AGCATTTGAG GAATATAGCG ATTTTCAAGC CCAAGTTAGG 
GTGATTGCAC CAATGAATAA AATTGTATCC GAGGAAGAAA AAAAGATTCA AGATGAAAAA 
ATTGCTGAGT TAGAAGAAGT ATTGTTCGAT TTTATTACGC CACCACTTAA TATAGCTGTT 
AGCCTGTTAT TAATTGGTAT TTTTGGCATA ATTATGGCAA TCGCTTTAAT GCGTCGTAAA 
AAATATGGTT TTTGGGGCAC GTTAATATAC AATGGTATCT TCTTATTTAT ATTTATTGCC 
CTTATAGTGA CCCTGAAGAG ATTAGAGCTT TTGGATGAAG AATCCTCGCA ACAAACCTTG 
CTCGATATAT TACCATGGGC CATGGAAAAT CCAATCTTAG CAACCTATCT CATTTTTCTA 
TTGGCTTGGG CCTATATTAA TATTAATTTG CTCTTTATTG CAGTAGGTTT GTATACGTTG 
ATTGTGCTTA TGCTTGGTTT TGCGTGGCGC ACGATCTCGC AGAAGGCTGT GCGTTTTGTG 
CCCCAATTCG AGGAGTTGGC CGAAGCCGAT GGCCATTTCA ATCGTGGAGT TGTCTATCAA 
AAGCGTGGGA TGTGGTATCT TTCTATGCTA GAGTGGGAAC GAGCAGTTAA GCTTAACCCA 
CGCGATTCGA CCTATCGCCA TGCCCTAGGC TTGATTTATG AGCAGCTGAA GCGGCCTGCT 
GATGCCTTGC AGCAATTTGA GCAAGCCCTC ACTGAAGATC CCAATAATCT GCGGATTAGC 
CAAGATCGTG ATCGTTTGGT GCAAACATTG CAAGCCTAG

Protein sequence

MSTEAFQAGV AALKSGNKAL AREHLMKVVE QDETNEQAWL YLAGALEDPA EMRISLENAL 
HINPQSKRAQ QGLEWLRKQH PAIFVEPTPA LPAATAPAYT GATVALADLP LADNPLPDQP 
ITPTPFPATQ PLGQASLPAT QPLGNGPLPA TQPLAPPAVG EVPDVLPCPR CGAPTRYVEQ 
RCRKCGMNLT IKTERQTQSK IPILIPGLLS LLPALLWIFL AGNIFVRAFE EYSDFQAQVR 
VIAPMNKIVS EEEKKIQDEK IAELEEVLFD FITPPLNIAV SLLLIGIFGI IMAIALMRRK 
KYGFWGTLIY NGIFLFIFIA LIVTLKRLEL LDEESSQQTL LDILPWAMEN PILATYLIFL 
LAWAYININL LFIAVGLYTL IVLMLGFAWR TISQKAVRFV PQFEELAEAD GHFNRGVVYQ 
KRGMWYLSML EWERAVKLNP RDSTYRHALG LIYEQLKRPA DALQQFEQAL TEDPNNLRIS 
QDRDRLVQTL QA