Gene Franean1_7266 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7266
Symbol
ID	5675567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8869852
End bp	8870856
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	74%
IMG OID	641246103
Product	hypothetical protein
Protein accession	YP_001511491
Protein GI	158318983
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03620] probable F420-dependent oxidoreductase, MSMEG_4141 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.282695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGACC CAGTGAGCGA CGCAGCCAGC AGCTCGGCGG GCCATCCCGG CACGCCCATG 
ACCGCCGGGA GCCCGCGGGG TTCGGAGCCG CCCGGCGAAC GCCCGCCGGC CGGGGCGATT 
CTCGGCAAGG TCGGCATCTG GAGCGGGCAG TTCGACTTCT CCAGCGCTGC CACGGTGCGC 
GAGGCGGTGT CCGAGCTCGA CGAGCTCGGC TACTCCACCC TGTGGACGGG CGAGGTCAAG 
GGCCGCGAGG TGCTGGTCAC CGCCGGCCTG ATGCTCGCGG CGACGTCCCG GATGACGATC 
GCGACCGGGA TCGCGCAGAT CCTCGCGCGC AATCCCCTGA CCATGGCCGC CGGCCAGCTC 
GCGCTCGCGG AGGCGTACCC GGGGAGGTTC CTGCTCGGGC TCGGCGTCTC GCACGCGGAG 
CTGATGCGCA TCCGCGGCGC GACCTACGCG AAGCCCCTGG GCCAGATGCG GGCCTACCTG 
GACGAGATGG ACCGGATGGC CGCCGAGCAG TACCGGGCGG TCCCGCCGGA GGGAGTCCAG 
CCGCGGGTGC TGGCCGCGCT GGGGCCGAAG ATGCTCGGCC TGGCAAGCGA GCGCGCGGAC 
GGCGCGCACA CCTACTTCGT GCCGCCGGAG CACACCGCCG ACGCCCGCGC GGCGCTCGGG 
CCGGGGAAGC TGCTGATACC CGAGCAGGCG TTCGTCCTGC ACCGGGACGC GAGCGAGGCG 
CGGGAGCTGG CCCGCCGGCA CACGGGGTCC TACCTGCGGC TGCCGAACTA CACGAACAAC 
CTGCGCCGGT ACGGCTTCAC CGATGACGAT CTCGCCGGCA CCGGGTCCGA CCTGCTGGTC 
GACACGATTG TCCCGTGGGG GGACGCCGAC GTCCTGCTCG GCCGGGTCAA GGAGCACCTG 
GACGCGGGCG CGGACCAGGT GGCCGTGCAG GTCCTGGACT TCGACCGCAG GGGGCTGCCG 
CGCCGGCAGT GGCGCGAGCT GGCCCCGGCG CTGCTGTCGC TCTGA

Protein sequence

MSDPVSDAAS SSAGHPGTPM TAGSPRGSEP PGERPPAGAI LGKVGIWSGQ FDFSSAATVR 
EAVSELDELG YSTLWTGEVK GREVLVTAGL MLAATSRMTI ATGIAQILAR NPLTMAAGQL 
ALAEAYPGRF LLGLGVSHAE LMRIRGATYA KPLGQMRAYL DEMDRMAAEQ YRAVPPEGVQ 
PRVLAALGPK MLGLASERAD GAHTYFVPPE HTADARAALG PGKLLIPEQA FVLHRDASEA 
RELARRHTGS YLRLPNYTNN LRRYGFTDDD LAGTGSDLLV DTIVPWGDAD VLLGRVKEHL 
DAGADQVAVQ VLDFDRRGLP RRQWRELAPA LLSL