Gene Franean1_3066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3066
Symbol
ID	5671445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3620896
End bp	3622359
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	66%
IMG OID	641241964
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_001507384
Protein GI	158314876
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGAGC GTGGGAAGTC GGATCGTCTT GTAGTACCTG CGAACCCGCC GAACAAGGCC 
ACAGCTGCGG AGGTGGGGGA GGGAAGGGGA CGAGCCAAGG GGAACACGGA CAGTAAAACG 
CATCCCGGAC ACAGCGCCGG AACTGATGCG TCCAGTGCGC TGGGCCGTGT GCGTGAAGTG 
GCACGACGGG ACAGGAACGC GCGGTTCACC GCGCTGCTGC ACCATGTCAC GCTGGGTCGG 
CTCCGGGAGG CGTATCGGGC GATCAGCCCG AAAGCGGCTG CTGGGGTGGA CGGGGTGACG 
TGGACCGACT ACGGGCAGGA CCTGGAGGCC AATCTGCAGG ATCTGCACGT GCGGGTGCAG 
TCGGGATGTT ACCGGGCGAC ACCGTCGAGG CGGGCGTACA TACCGAAGGC GGACGGGCGG 
CTTCGGCCGC TCGGGATCGC CTCGCTGGAG GACAAGATTG TTCAGCGGGC GGTTGTCGAG 
GTGCTGGGCG CCGTCTACGA GGTGGACTTC CGGGGCTTCT CGTATGGGTT CCGGCCGGGG 
CGGGGTCCGC ATGACGCGTT GGACGCCCTC GCGGTCGGGA TCTGGAGGAA GCGGGTGAAC 
TGGGTGCTCG ACGCGGACAT CCGCGACTTT TTCGGCCAGA TTGATCATTC CTGGCTGCGG 
AGGTTTCTGG AGCACCGGAT CGCGGACAAG CGGGTCCTGC GGCTGATCGA CAAGTGGTTG 
GCCGCGGGGG TCGTCGAGGA TGGGGAGTGG ACAGCGTGTG AGGAAGGTTC GCCACAAGGG 
GCGTCAGTGT CCCCGCTGCT GGCGAACGTC TACTTGCACT ATGTCCTCGA CCTGTGGGTC 
GACTGGTGGC GGCGTCGCCA CGCGCGCGGA GATGTCATTG TCGTGCGCTG GGCCGACGAC 
TTCATCGTCG GGTTCGAATA CGAGGAGGAT GCGCGGCGGT TCCTGGACGA GCTGCGCGAA 
CGGTTCGCGA AGTTCGGGTT GGAACTGCAC CCGGATAAGA CGCGGCTGAT CGAGTTCGGG 
CGGTACGCCG CCCGGGATCG GAAGCGGCGG GGTCTGGGCA AGCCGGAGAC GTTCGACTTT 
CTGGGGTTCA CGCACATCTG TGCGACATCC CGGAGGGGGA CGTTCTGGCT CAAGCGCATC 
ACGATCGCGA AACGCATGCG GGCGAAGCTG AAGGCGGTCA ATGAGCAGCT GAAGCGTCGC 
CGGCATACGC CCATCCCGGA TCAGGGACGC TGGTTGGCGA GCGTGCTACG TGGGCATATG 
GCCTACTACG CCGTGCCCGG CAACACCGAC ACGATGTCGG CCTTCCGTAC CCAGGTGACA 
CGGCACTGGT GCAAGGCGCT GCGGCGCCGC AGCCAACGTG ACCGGATGAA CTGGCAACGG 
ATGGGGCGGA TCGCGGCTCG ATGGCTACCC CCAGTCCGAG TGATGCATCC CTTCCCGGAG 
AGACGCTTCG CAGCCAGAAC CTGA

Protein sequence

MHERGKSDRL VVPANPPNKA TAAEVGEGRG RAKGNTDSKT HPGHSAGTDA SSALGRVREV 
ARRDRNARFT ALLHHVTLGR LREAYRAISP KAAAGVDGVT WTDYGQDLEA NLQDLHVRVQ 
SGCYRATPSR RAYIPKADGR LRPLGIASLE DKIVQRAVVE VLGAVYEVDF RGFSYGFRPG 
RGPHDALDAL AVGIWRKRVN WVLDADIRDF FGQIDHSWLR RFLEHRIADK RVLRLIDKWL 
AAGVVEDGEW TACEEGSPQG ASVSPLLANV YLHYVLDLWV DWWRRRHARG DVIVVRWADD 
FIVGFEYEED ARRFLDELRE RFAKFGLELH PDKTRLIEFG RYAARDRKRR GLGKPETFDF 
LGFTHICATS RRGTFWLKRI TIAKRMRAKL KAVNEQLKRR RHTPIPDQGR WLASVLRGHM 
AYYAVPGNTD TMSAFRTQVT RHWCKALRRR SQRDRMNWQR MGRIAARWLP PVRVMHPFPE 
RRFAART