Gene Franean1_1310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1310
Symbol
ID	5675675
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1581372
End bp	1582658
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	66%
IMG OID	641240241
Product	RNA-directed DNA polymerase
Protein accession	YP_001505669
Protein GI	158313161
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.389336
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGTTCA CCGCGCTACT CCACCACGTG GACCTGGACC GCCTGGAGGC GGCGTACCGG 
GCGATCCGCC CGCAGGCCGC GCCCGGCGTG GACGGAGTGA CGTGGCGGGA GTATGGGCGG 
GACCTTCAGG GTAACCTGCG GGACCTGCAC GCCCGGATCC ATTCGGGGCG TTACCGGGCG 
AGTCCCTCGC GGAGGGTGTA CATCCCGAAG GCGGACGGGC GGCAGCGGCC GCTCGGTATC 
GCCACGCTAG AGGACAAGAT TGTCCAGCGG GCGGTCGTCG AGGTGCTGAA CGCCATCTAC 
GAGGAGGACT TCCTCGGCTT TTCGTACGGG TTTCGGCCGG GGCGAAGCCA GCACATGGCG 
CTCGACGCGC TCGCGGTCGG GATCCAGCGG AAGAAGGTGA GCTGGGTGCT CGACCTGGAC 
ATCCGGGATT TCTTTTCCAG CCTCAGTCAT CAATGGCTGG TCAAGTTCCT TGAGCACCGG 
ATCGCGGACA AACGGATCCT GCGCCTGGTC CAGAAATGGC TGAGCGCGGG AGTCATCGAG 
AACGGCGCGT GGTCACAGAC AATGGAAGGG TCACCGCAGG GGGCTTCGGT ATCGCCGCTG 
CTCGCTAACG TGTACCTGCA CCACGTCTTT GACCTGTGGG TGCGGTGGTG GCGGAATCGC 
CAGGCGCGTG GTGATGTGAT CACCGTGCGT TTTGCTGACG ACGCTGTCGC CGGCTTCGAG 
TACGAGGATG ACGCGCGGCG GTTCCTTGTC GATCTTCGGG ACAGGTTCGC GAAGTTCGGC 
CTGGGGTTGC ATCCCGACAA GACCCGGCTG ATCGAGTTCG GGCGGTTCGC CGCCCGGAAC 
CGGTCGCGGC ATGGGCAGGG CAAACCCGAG ACGTTCAGCT TCCTGGGCTT CACGCACATC 
TGCGCGACGG GCAAGCGGGG CTACTTCTGG GTGCGGCGGG TCACGGACAA GAGGCGGATG 
GCGGCGAAGC CACGCGAGAT CAAGGTCGAA GCGAAGCGGC GCAGCCACCT ACCCATCCCC 
GTCCAGGGGC AATGGTTGCG CAGCGTGGTC AACGGCCACC TGAACTGCTA TGCCGTGCCC 
GGCAACATGA ACGCGACGGC TTCATTCCGC TACGAGGTGC TCCATGCCTG GCACAAGGCG 
CTATCGCGCC GTAGTCAGCG CGGGCACCTG AACTGGGGAC GGATGGGGCC CATCGCGAAC 
AGGTGGCTAC CGACCGCAAA GGTCCGACAT CCCCTGCCTA CCGTTCGGCT CGACGCCAAT 
ACCCGAGGCA GGAGCCCAGT GCGGTAG

Protein sequence

MRFTALLHHV DLDRLEAAYR AIRPQAAPGV DGVTWREYGR DLQGNLRDLH ARIHSGRYRA 
SPSRRVYIPK ADGRQRPLGI ATLEDKIVQR AVVEVLNAIY EEDFLGFSYG FRPGRSQHMA 
LDALAVGIQR KKVSWVLDLD IRDFFSSLSH QWLVKFLEHR IADKRILRLV QKWLSAGVIE 
NGAWSQTMEG SPQGASVSPL LANVYLHHVF DLWVRWWRNR QARGDVITVR FADDAVAGFE 
YEDDARRFLV DLRDRFAKFG LGLHPDKTRL IEFGRFAARN RSRHGQGKPE TFSFLGFTHI 
CATGKRGYFW VRRVTDKRRM AAKPREIKVE AKRRSHLPIP VQGQWLRSVV NGHLNCYAVP 
GNMNATASFR YEVLHAWHKA LSRRSQRGHL NWGRMGPIAN RWLPTAKVRH PLPTVRLDAN 
TRGRSPVR