Gene Franean1_7303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7303
Symbol
ID	5675604
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8924909
End bp	8926108
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	73%
IMG OID	641246140
Product	hypothetical protein
Protein accession	YP_001511528
Protein GI	158319020
COG category	[S] Function unknown
COG ID	[COG4301] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03438] probable methyltransferase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0723048
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATCGA GGACACCGGC TACCGCCCCG GAGACGATTC CCGTGCCCGG CAGGCAGCCG 
CATCCCGCCA CGGCCACCGA CGGGTCCGAC CCGTCGGGCG GGCCCGACAA ACCCGCCCGA 
ACGGACCAGA CCCCGCAGAT CACCGTGGAC CGCCACCTCA CCGCCGCCGA ACGGCACGCC 
TCGCTCGCCG CGGACATGCG CGCCGGCCTG ACCTCCCACC CTCGTGAGCT GCCACCCAAG 
TGGTTCTACG ACGCCACCGG CAGCCTGCTG TTCGACCGGA TCACCCGCCT GCCCGAGTAC 
TACCCGACCC GCCGCGAGCA CGCGGTGCTC ACCGCGCACG CCGCCGAGAT CGCCGCCGTC 
TGCCCGGCCG GCACCCTCAT CGAGCTCGGC TCCGGCACCT CGGAGAAGAC CCGCCTGCTC 
CTCGACGCGC TGCGCGCCAC CGGGGTGCTA CGCCGCTTCG TCCCCTTCGA CGTGGACGAG 
GAGACCCTGC TCCAGGCCGG ACAGGACATC CTGCGGGCGT ATCCGGGAAT CTCGGTGCAC 
GCGGTGGTCG GGGATTTCGA GCGCCACCTC GGCCTTCTCC CCGGCGCCCG GCCCGCCGCG 
GACACGGGCG CGGCGGCGGG CGCCGGTGCT GCCGGCGCTG ATGGCGGCGC TGCCGGTGTT 
GATGGCGGCC ACGGTGGAGG CCGCGACGAC CGGCGGCTTG TGGCCTTCCT CGGCGGAACC 
ATCGGCAACC TGCGGCCCGC GGCGCGCGCC GCCTTCCTGC GCGCCCTGAG CAACCAGTTC 
ACCGACGGCG ACGCCCTGCT CCTCGGCGCC GACCTGGTGA AGGACCCGCG ACGCCTCGTC 
GCGGCCTACG ACGACAGCGC CGGCGTGACA GCCGCCTTCA ACCGCAACGT TCTCTCAGTG 
ATCAACCGGG AGCTGGGGGC CGACTTCGAC CTGCGCGGGT TCGCCCACGT CGCCGCCTGG 
GACGCGGAGA ACTCCTGGAT CGAGATGCGC CTGCGCAGCG TCCGCGAGCA GGAGGTCGGG 
GTCCGCGCCC TGGACCTGGT CGCCCGCTTC GACGCCGACG AGCAGATGCG CACCGAGATC 
AGCGCCAAGT TCACCCTCGA CGCGATCGCC GCCGAGCTGG CCGCGGCCGG ACTCTCCGTC 
AGCCACCAGT GGACGGACCC AGACGGCGAC TTCGCCCTGA CCCTGGCCGT CCCCTCCTGA

Protein sequence

MTSRTPATAP ETIPVPGRQP HPATATDGSD PSGGPDKPAR TDQTPQITVD RHLTAAERHA 
SLAADMRAGL TSHPRELPPK WFYDATGSLL FDRITRLPEY YPTRREHAVL TAHAAEIAAV 
CPAGTLIELG SGTSEKTRLL LDALRATGVL RRFVPFDVDE ETLLQAGQDI LRAYPGISVH 
AVVGDFERHL GLLPGARPAA DTGAAAGAGA AGADGGAAGV DGGHGGGRDD RRLVAFLGGT 
IGNLRPAARA AFLRALSNQF TDGDALLLGA DLVKDPRRLV AAYDDSAGVT AAFNRNVLSV 
INRELGADFD LRGFAHVAAW DAENSWIEMR LRSVREQEVG VRALDLVARF DADEQMRTEI 
SAKFTLDAIA AELAAAGLSV SHQWTDPDGD FALTLAVPS