Gene Franean1_0727 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0727
Symbol
ID	5669143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	844773
End bp	845933
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	75%
IMG OID	641239654
Product	hypothetical protein
Protein accession	YP_001505091
Protein GI	158312583
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.170117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0978354
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCTGGC CGCTGGCGGG TCCGCCACTT GGCTCGAAGC AACCTTCGCG ACGGAGGATC 
CCGCATACGC TGCGATCCGT GGGGAAATCC GGGCGGGGCG ACGAGCTCAC CCCGGGGGAG 
GCCCGGCGGC TCGCGCTCGC CGCCCAGGGG CTGATCCGTC CCCACGGGCC GGCCACGGCC 
GGTGCCCGCG CCATCCGGAA CCTGTTCGAC CTGGTCGGCG TCGTGCAGAT CGACTCGGTG 
AACGTGCTGG CCAGGGCGCA CTATCTGCCC GGCTTCTCCC GCTTCGGCCC CTACCCGACC 
GACGCCCTGG ACAGCCACGT ACACACCGAC CGCAAGGCGT TCAAGTACTG GGCCCACGAG 
GCGTCCCTCG TTCCCGTGCA GTGGCAGCCG CTGTTCCGCT GGCGGGCCGA GCGGGCGCTG 
GCAGGGGAGG GCATCTGGCC CGGTATCGCA CGGTTCGCGC GCGATCGGCC CGGCTACCTC 
CGGGACGTGC TGGCGCAGGT CACGCAGCGC GGTCCACTCG CCGCCTCCGA TCTCGCTCCG 
CCCGCCGCCG AGGTCCTGCC TGGTGTCGGC ACCGGTGGGC CCGCGGGCCC GGCTGGTGGG 
GGCGGGCCGG CCGTCCCGGC GGCGCCGCGG ACGTCCTGGT GGGGCTGGGT CGAAGCAGGG 
GCGCTCACCA AGGTCCGAGT CAGGGGCTGG CCCGCCCCTG CCTACGTGCT GCCGGGCACG 
CCCGTCCCGC GGGGCGCGCG GGTCCGGGCG CTGCTCTCAC CGTTCGACCC GCTGGTCTGG 
GAGCGCTCGC GGACCCGCCG CCTGTTCGGG ATGGACCTCG TCCTGGAGAT CTACACGCCC 
GCGCCCAAGC GCCGGTTCGG CTACTACGTT CTGCCCTTCC TGCTGGACGA AGAGCTCGTC 
GCCCGGGTCG ACCTGAAAGC CGACCGTCGC GCACGGGTCC TCCGGGTGCC CGCCGCCTGG 
GACGAGGCGA CCGAGACGGG ACGCGGCTCG CCCCCGGCGG AGACCGCCGC GGCGCTGGCG 
ACCGAGCTCA GGACCCTGGC CCGCTGGCTG GAGCTGGATG GCATCGAGGT CGAGCCGCGG 
GGCTCGCTGG CCGGCGCCCT CGCCCGCGAG CTCGGGTCGC GCTCGGTGAG CGGAACGTCC 
AGCGAGCGCA GCGCAGTGTG A

Protein sequence

MGWPLAGPPL GSKQPSRRRI PHTLRSVGKS GRGDELTPGE ARRLALAAQG LIRPHGPATA 
GARAIRNLFD LVGVVQIDSV NVLARAHYLP GFSRFGPYPT DALDSHVHTD RKAFKYWAHE 
ASLVPVQWQP LFRWRAERAL AGEGIWPGIA RFARDRPGYL RDVLAQVTQR GPLAASDLAP 
PAAEVLPGVG TGGPAGPAGG GGPAVPAAPR TSWWGWVEAG ALTKVRVRGW PAPAYVLPGT 
PVPRGARVRA LLSPFDPLVW ERSRTRRLFG MDLVLEIYTP APKRRFGYYV LPFLLDEELV 
ARVDLKADRR ARVLRVPAAW DEATETGRGS PPAETAAALA TELRTLARWL ELDGIEVEPR 
GSLAGALARE LGSRSVSGTS SERSAV