Gene Haur_5150 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Haur_5150
Symbol
ID	5737108
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Herpetosiphon aurantiacus ATCC 23779
Kingdom	Bacteria
Replicon accession	NC_009973
Strand	+
Start bp	217654
End bp	219408
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	45%
IMG OID	641282315
Product	RNA-directed DNA polymerase
Protein accession	YP_001547906
Protein GI	159901660
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTAC ATCTTTCGTC TGATCCCGAT ACCCTTCGCC AGCAATTCTT TCAGCTAAAA 
AGCCGCGATG ATCTCTTAAA CCTCTTAGAT ATTTCTCAAC AACAGCTTCT CTATTATTTA 
TACATCTGCC CTGAAAATAA GCGCTATCGC CACCTCCGCT TACGAAAAAA AAGGGGCGGC 
TATCGCACTA TTTACGCACC TGCAACACAT CTCAAAATAG TCCAACAAAA ACTTTCCTCC 
ATTTTACAGT TGATCTATGA ACAAAAACCC GCAGTCCATG GGTTTGTCCC GCACAAAAGT 
ATTGTCTCCA ATGCTGCTAT GCACCTCAAC AAAACCTACG TGCTCAATCT TGATTTACAA 
GATTTCTTTC CATCCATCAA TTTTGGGCGG GTTCGAGGTC TTTTTATGAA TCAACCATAT 
TATCTCAATG AGGAGGTCGC AACCATCCTT GCGCAAATCT GCTGCCATCG CAATACACTC 
CCCCAAGGTG CGCCCACATC CCCCGTTATC TCGAATATGA TTTGCGCTAA ATTAGATCGG 
GAATTACTCC GTTTTGCCCA AGCCAATCGC TGTGTTTATA CGCGGTATGC CGATGATCTC 
ACCTTTTCAA CTAATACGCG GCAACCACCT TCCAAACTAG TGCGTCGTAC TGAGGCTACA 
GCATCTATTG AACTTGGGCG TGATTTAGTT TCAATCATTA CAGCGAATGG CTTTCAGGTT 
CATCCAGAAA AATCACGGCT TCAGGTCAAA GGTCGTCGCC AAGAAGTCAC GGGTCTTACT 
GTAAATCACT TTCCCAATGT ACCGCGGAGA TTGATTCGGC AGATCCGGGC AATGCTCCAT 
GCATGGCGAA AGTTTGGGTT GGATGCTGCG CAACAGCACT ACTATGCTCA CTATTGTCAT 
CGTCAGTATC CAGTATTCAA ACCACGACCT CCCTTTCGGC AAGTCTTGAT TGGAAAAATC 
GCATTTGTTG GTATGGTACG CGGCAAACAT GATCAACTCT ATCTCCGTCT TCGCGATCAA 
TTGCTCAACC TTGACCCCAC CTATCGGGCA GCAGTGGAGA AAAAGGCCGA AGAAACATTC 
ATCCTGAGTA CGCCACTTAT CAAAACCGAA GGAAAAACTG ATTGGAAACA CATCAAACAT 
GCCTTACGGG TTTTGCAAGC ACAGGGGCTG TATGCGGGGT TATCCCTCGA TTTTGATGAA 
AGTCTCACCG AGGGTGGAAG CAGTGAGCTA AAAAAAACGT GCTACTATCT TTCACGCGTG 
AAACAAGCTC AAATTATTAT TGCGTTGTTT GACCGCGATG AACCGAATAT TATTCGCGAA 
GTAGCAGATG GTGATAGATT CAAGGCATGG GGGAACCAGG TATTCTCCTT CGTGCTTCCT 
ATTCCTGATC ATCGAACACA CACGCCAGAT ATTTGTATTG AATTCCTCTA TCCCGATAAC 
AATCTCCTTC TTGTGGATGA GCATGGACGA CGCTTATACC TCAGCTCCGA GTTTCATGAA 
ACATCAGGAC GGCATAAAGA AAACCCAGCG ATTTCCTGCC TGCTTTCGTC GAAATTCAAG 
AAAGATGCCA AACTGTCGAT TATTGATGCT TCGGTCTTTG ATGCGAATCA TCGCAGTATT 
GCACTCGCGA AAGATGCGTT CGCAGACTAC ATTCTTCATG ATCAAGTCCC ATTTAATCGC 
ATGAATCTCG ATGGATTTAA GCCTATCTTT GATATGATTA TCGCAATTCT TCGTGCCGAG 
ACAAACAAGA CATAG

Protein sequence

MSLHLSSDPD TLRQQFFQLK SRDDLLNLLD ISQQQLLYYL YICPENKRYR HLRLRKKRGG 
YRTIYAPATH LKIVQQKLSS ILQLIYEQKP AVHGFVPHKS IVSNAAMHLN KTYVLNLDLQ 
DFFPSINFGR VRGLFMNQPY YLNEEVATIL AQICCHRNTL PQGAPTSPVI SNMICAKLDR 
ELLRFAQANR CVYTRYADDL TFSTNTRQPP SKLVRRTEAT ASIELGRDLV SIITANGFQV 
HPEKSRLQVK GRRQEVTGLT VNHFPNVPRR LIRQIRAMLH AWRKFGLDAA QQHYYAHYCH 
RQYPVFKPRP PFRQVLIGKI AFVGMVRGKH DQLYLRLRDQ LLNLDPTYRA AVEKKAEETF 
ILSTPLIKTE GKTDWKHIKH ALRVLQAQGL YAGLSLDFDE SLTEGGSSEL KKTCYYLSRV 
KQAQIIIALF DRDEPNIIRE VADGDRFKAW GNQVFSFVLP IPDHRTHTPD ICIEFLYPDN 
NLLLVDEHGR RLYLSSEFHE TSGRHKENPA ISCLLSSKFK KDAKLSIIDA SVFDANHRSI 
ALAKDAFADY ILHDQVPFNR MNLDGFKPIF DMIIAILRAE TNKT