Gene Franean1_3413 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3413
Symbol
ID	5671784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4042777
End bp	4044030
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	61%
IMG OID	641242301
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_001507721
Protein GI	158315213
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.344584
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGGAC CAGCATCGCG GGGAAAGTCG TTTGAGATCC CCAAACAGCT GGTGTGGGAT 
GCCTGGCTGA AAGTGAAGGA AAACGGTGGG GCACCGGGGC CCGACGGAGT GACGGTCGAG 
CAGTTCGAGG CGAACGTGAA GGATCGCCTG TACGTGCTGT GGAACCGCAT GTCGTCGGGG 
TCGTACTTCC CCGGACCCGT CGGAGCGGTG GAGATCCCGA AGAAAGGTGT GAAAGGAGGA 
GCAAGAACCC TCGGCATTCC CAATGTAGTA GATCGCGTAG CGCAGACGGT GCTAAAGCTG 
GCTCTGGAGC CGAAGGTCGA GCCGGTGTTC CACCGGGACT CGTACGGCTA CAGACCAGGC 
CGTTCGCAGC GCCAGGCGCT CGAGGTCTGC CGGAAGCGGT GCTGGTCGCA CGACTGGGTC 
GTTGACTTGG ACGTGCGGAA GTTCTTCGAC ACCGTGCCGT GGGAAAAGCT GCTGAAGGCG 
GTGGCGTACC ACACGGACCA GAAATGGGTC CTGATGTACG TGGAACGCTG TCTGAAAGCG 
CCGACGAAGC ATGCCGACGG AACCCTGCAA GAGAGAACCA TGGGCACAGT CCAGGGTGGC 
CCATTCTCCC CGCTGGCGGC TAACATCTAT CTGCACTGGG GCCTTGACGC CTGGATGGCG 
CGCGAGTTCC CGACCGTTCC ATTCGAGCGG TGGGCGGACG ATGTTGTGTT TCACTGTGTG 
AGCCTGGAAC AGGCCAGGGA AGTGCGGGAC GCGGTGGTGG CAAGGCTTGT CGAAGTCGGG 
TTGGAAGCTC ACCCCGACAA GACCCGGATC GTGTACTGCA AGGACAGCAA CCGAGGTGGC 
GACTATGAAA ACACGTCGTT CACGTTCCTG TCGTATACCT TCAGGCCACG AGTGGCATGG 
AACGGCACCC AGAAGAAACG CTTCACCAGC TTCATCCCGG GTGCCGCGCC GGATCGGGTG 
GCCTCGTTCA GCCGCGAAAT GCGCGACCTG AGGCTGCACA GGCGAACGAA CCTGACACTG 
GATCAACTCG CCGCGGACAT CAACCCGAAA GTGGCGGGTT GGCTAGAATA TTTCACCATG 
TTCTACCCGA GCGTGGTGCT ACCCATCGGC ACGCGCATTG ACAGCCATCT CGTGCGCTGG 
GCGAGGAAGA AGTACAAACG GCTGACACGA AGTGAGCGTA GGGCGTGGGC ATGGCTCAAG 
GGAGTCCGGG AACGGTCCCC TGACCTGTTT GCGCACTGGG CGTTGCGGTA CTGA

Protein sequence

MSGPASRGKS FEIPKQLVWD AWLKVKENGG APGPDGVTVE QFEANVKDRL YVLWNRMSSG 
SYFPGPVGAV EIPKKGVKGG ARTLGIPNVV DRVAQTVLKL ALEPKVEPVF HRDSYGYRPG 
RSQRQALEVC RKRCWSHDWV VDLDVRKFFD TVPWEKLLKA VAYHTDQKWV LMYVERCLKA 
PTKHADGTLQ ERTMGTVQGG PFSPLAANIY LHWGLDAWMA REFPTVPFER WADDVVFHCV 
SLEQAREVRD AVVARLVEVG LEAHPDKTRI VYCKDSNRGG DYENTSFTFL SYTFRPRVAW 
NGTQKKRFTS FIPGAAPDRV ASFSREMRDL RLHRRTNLTL DQLAADINPK VAGWLEYFTM 
FYPSVVLPIG TRIDSHLVRW ARKKYKRLTR SERRAWAWLK GVRERSPDLF AHWALRY