Gene Haur_4791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_4791
Symbol
ID	5736635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009972
Strand	+
Start bp	6106257
End bp	6107939
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	54%
IMG OID	641281956
Product	RNA-directed DNA polymerase
Protein accession	YP_001547550
Protein GI	159901303
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGCAG AAACCTCTGC TGGTGCGGCC TCCCGCAGTG AGGTCGAGTG GCATGCCATT 
AACTGGCAAC ACGTGAACCA AACTGTGCGT CGGCTGCAAT CCCGTATCGT GAAGGCAACA 
CAGGCGGGAC GCTATGGCAA GGTGAAAGCT TTGCAACGGC TCCTGACCCA CTCGTTCAGC 
GGCAAAGCCC TTGCCGTGCG ACGAGTGACG GAAAACCAAG GCAAACGGAC ACCGGGAGTG 
GATCAGGTCA TCTGGGACAC CCCCGAAAAG AAAGCAACGG CCATCCGATC GTTGCGACGA 
CGTGGCTATC AGCCGCGTCC GTTGCGACGC ATCTACATTC CAAAGAAGCA TGGAAAACGA 
CGACCCCTTG GCATCCCAAC GATGCACGAC CGAGCCATGC AGGCACTCCA CCTGCTTGCG 
CTTGCTCCCA TCGCGGAAAC AACCGCTGAC CCAAACTCCT ATGGATTTCG GTCAGAACGG 
GCACCAGCAG ATGCCATTGG GCAATGCTTT GTTGCACTCG CGAAACGGAA GGCACCAACG 
TGGATTCTGG AAGGCGACAT CCGATCATGC TTCGACCGAA TTAGCCACGA CTGGCTTTTG 
GCTCATGTCC CAATGGATAA AGCCATCCTT CAGAAATGGT TAAAGGCCGG GTACATGGAA 
GGAACAACGC TCTACCCCAC CGAGCACGGC ACACCGCAGG GCGGGATTAT CTCGCCAGTA 
TTAGCCAATC TCGCGCTGGA TGGCCTCGAA CGAATCCTCT TGGAGCATTG CCCCAGAAGG 
ACAGTTCGCG GTATTGCCGC AAAAGTCAAT CTTGTGCGGT ATGCGGATGA CTTCATTATC 
ACAGGCAGAT CGCGAGAACT GCTCGAACAG ACAGTCAAAC CGCTGGTAGA AGCATTCCTC 
AAGGAACGAG GTCTGGAACT CGCACCGGAG AAAACGCGGA TCACGACCAT TGAGGAAGGC 
TTTGATTTTC TTGGACAGAA TGTACGCAAG TACAAGGGGA TACTGCTGAT TAAGCCCTCA 
ACGGCGAGTC AACGGACATT CCTCGCCACA ATCCGAGCCA CGATCAAAGC CAATATGGCC 
TTGGATGCCG AGAAGTTGAT CCGGCTGCTC AATCCCATCA TCTCGGGATG GACAGCCTAT 
CACCATCATG TTGTCTCAAA GGCTGTGTTT CAATCTATGG GCCATGCAAT TTATCAAGCG 
CTATGGCGCT GGGCAAAACG AAGACATGCC AACAAACCAA AACGCTGGAT CAAAGAGAAA 
TACTTCCGAC CAGTCAATGG AAATCAGTGG GTGTTTTCGG GAGATAGTGC AGGTCGCCCA 
ATACGTTTAG TTGCCGCAGG ATACGTGCCG ATTAAACGGC ATGTCAAAAT CCGAGCAGCG 
GCTAATCCAT ACGACCCAGC GTGGGAGATG TATTTTGAAA CCCGACTTGG GGTAAAGATA 
GCATCAACCC TCAAGGGACG ACGACAACTC CTGCACTTGT GGAAACGACA AAACGGAATT 
TGCCCCTGTT GCCAAGAACC GATCACAATG CTGACGGGAT GGCACAACCA TCACGTCATT 
CGGCGGATCG ACGGCGGAAC AGACACGGCG GAAAACCGTA TGTTAGTCCA CCCCACATGC 
CATACGCAAA TCCATAGCCA GAGGTTAACC GAAGTGAAAC CGTGTCTCGA AAGAGGCAAG 
TGA

Protein sequence

MMAETSAGAA SRSEVEWHAI NWQHVNQTVR RLQSRIVKAT QAGRYGKVKA LQRLLTHSFS 
GKALAVRRVT ENQGKRTPGV DQVIWDTPEK KATAIRSLRR RGYQPRPLRR IYIPKKHGKR 
RPLGIPTMHD RAMQALHLLA LAPIAETTAD PNSYGFRSER APADAIGQCF VALAKRKAPT 
WILEGDIRSC FDRISHDWLL AHVPMDKAIL QKWLKAGYME GTTLYPTEHG TPQGGIISPV 
LANLALDGLE RILLEHCPRR TVRGIAAKVN LVRYADDFII TGRSRELLEQ TVKPLVEAFL 
KERGLELAPE KTRITTIEEG FDFLGQNVRK YKGILLIKPS TASQRTFLAT IRATIKANMA 
LDAEKLIRLL NPIISGWTAY HHHVVSKAVF QSMGHAIYQA LWRWAKRRHA NKPKRWIKEK 
YFRPVNGNQW VFSGDSAGRP IRLVAAGYVP IKRHVKIRAA ANPYDPAWEM YFETRLGVKI 
ASTLKGRRQL LHLWKRQNGI CPCCQEPITM LTGWHNHHVI RRIDGGTDTA ENRMLVHPTC 
HTQIHSQRLT EVKPCLERGK