Gene Franean1_0654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0654
Symbol
ID	5669071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	764443
End bp	765618
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	65%
IMG OID	641239581
Product	hypothetical protein
Protein accession	YP_001505019
Protein GI	158312511
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.613109
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.861609
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGTATG GGAACCACCA TGTGTTCCGC CGCTCACGTC TGCGCGGGCG TGACCGGCCT 
GGGGGGTTGG TCGTAACCAA GAAAGGCCTC GAGAGAGGGG CGTCCGTGCG AACGCTCGAA 
CCCACCACCC TCGACCTCGA CGCGATCGAG GTGGACAAGC TCAACAAAGG CGTCACGCTC 
AGTCTGCTGA TACCCGCTCG CGGGCCTGAG GCGGCGCGGA CGCTGGGAAC CATCGTCGCG 
CTCAACCGGC AACGCTGGAT GCAGGAACGC AGTGTCCTCG ACGAGATCGG GGTCATAGTG 
GACCCCTCCT CGGACGGAGA CGAGCACGAT CTCGTCCGGA TCGCGACCGA GGCGGGCGCG 
AGCTGGGTCG TGCGCGGCCA GTCCGTCCTG GAGCTCCACG CGGGGCGGGA GGCGGCCACG 
ACCGGAGGCA AGGCGGGTGC GATGCGCAGT CTCGCCTACC TTGCGTTCGG AAATCGCCTC 
ATATTCCATG ACGCGGACCT CGAAAGCTAC GACCCCGCCA CCGTAGGTGT TCTCGCCGCC 
GCCGCGACGG CTGGCAACGC CCCGCTTTTC GTGAACGGAA GCTCGCGCAG GGTCACCGGG 
GACGGTCAGC CCGGTGGACG TACGACCGAG ATGCTGCGCT CGCTGCTCTC GAAACAACTC 
GCGCGCTATG TGCCGTCCAT CACGCGGGCA ATCCAGCCGT TGATCGGGGA GTTCGTCATC 
GACGCCGACG TCTTTGCGGC GCTCGCGTTC TCCCGCGGCT ACGGGGTGGA GACCTCGCTG 
AAGGTTCTGG CTCTCGACCT TCTCGACTAC TCGGACTGTC TCCAGGTTGA GCTGCCGATC 
AAGTATCAGG TTGGTCAGCA CTACCACAAC CTGGTCAAGC AGTTCCATGA GATCAGTTTC 
ACAATCGACG TTCTCGAGGC GTACTTCCAA CGCCGCCGGG TCGATCCGCA CGTCGCCATC 
TGGCAGATTG CCGACAACTA CGACCTCCTA TTCCCGGGGC GTACGTACGC CCTGCACCGA 
CCGCCGGGTT ACGACGACAT CGACTTCGTC CCGCGGCTGG GCTTCTACCA GCCGCTCGCG 
ACGTCGTCGG CCTACCAGGC CCGGCTACCC GAGATCAAGA GTGCTCGCCG TGTCGCACTG 
GACACGCTGA GTAGGCGGAT GCGGGCCTCC GCCTGA

Protein sequence

MLYGNHHVFR RSRLRGRDRP GGLVVTKKGL ERGASVRTLE PTTLDLDAIE VDKLNKGVTL 
SLLIPARGPE AARTLGTIVA LNRQRWMQER SVLDEIGVIV DPSSDGDEHD LVRIATEAGA 
SWVVRGQSVL ELHAGREAAT TGGKAGAMRS LAYLAFGNRL IFHDADLESY DPATVGVLAA 
AATAGNAPLF VNGSSRRVTG DGQPGGRTTE MLRSLLSKQL ARYVPSITRA IQPLIGEFVI 
DADVFAALAF SRGYGVETSL KVLALDLLDY SDCLQVELPI KYQVGQHYHN LVKQFHEISF 
TIDVLEAYFQ RRRVDPHVAI WQIADNYDLL FPGRTYALHR PPGYDDIDFV PRLGFYQPLA 
TSSAYQARLP EIKSARRVAL DTLSRRMRAS A