Gene Franean1_3381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3381
Symbol
ID	5671752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4006202
End bp	4007215
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	69%
IMG OID	641242269
Product	luciferase family protein
Protein accession	YP_001507689
Protein GI	158315181
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03560] probable F420-dependent oxidoreductase, Rv1855c family [TIGR03621] probable F420-dependent oxidoreductase, MSMEG_2516 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGAGC CGAGCGAGGC TCATCCGTCA CCGGCGCGGC CGATCCGGTT CAACACCGGC 
CCGGGCCGGA TCTCCGACCT CGCGGCGCTC CGGGAGGCTG GGCAGGCCAT CGAGGGTCTC 
GGCTACTCGA CCTTCGCTCT CGCCGACCAT TTCATGATCC GGTACGCTCC GCTGATCGCG 
CTCCAGGCGG TCGCCGACGC GACCAGCACG CTGCGGCTGA CCCAGACTGT CCTCAACCAG 
GATCTACGGC ATCCCGCCGT CCTCGCCAAG GAACTCGCCA CCCTGGACGT GCTGTCCCAG 
GGGCGTCTGC AGGTGGGGCT CGGCGCGGGA TGGATGCAGG CCGAGTACCA ACAGGCCGGC 
ATCCGGTACG ACCCGGCCGC CGCGCGGATC GCGCGGCTCG AGGAAGTGGT CATCATCCTG 
AAAGGCCTGT TCGGAGATGA TCCGTTCAGC TACTCAGGCG CGAACTTCAC GATTGATGCT 
CTTCGTGGCA CCCCGCGGCC TCTGCAGCGT CCGCACCCGC CGATCATGAT CGGCGGCGGT 
GGCCGCAAGC TGCTCTCGGT CGCCGGGCGC CATGCCGACA TCGTGCAGAT CATGCCCCGG 
CTTCCGCAGG AGGTCCGGCC GGCCGAACCG CACCCGTTCA GCGGCGAGGC CTACGAGGAG 
AGAATCGGCT GGGTCCGCGC TGCCGCCGGG GACCGCTTCG GCGACATCGA GCTGGGAGCC 
CAACTGCTGA ACGTGACGAT CACCGATGAT CCGGAAGCGG CGTTTGAGGC CTGCTTTCAG 
AGCTTTGGCC GGCAGGTCCG AGGATCGTCC GGGGGCGCCG TCCCGTCGCG AGCGGACCTC 
GGCTCGTCGC CGATGGTGGC CATCGGTTCG CTGGACGACG TCTGCCGGAA AATCCTGGAC 
ATCCGTGACC GGTTCGGGAT CAGTTACTTC ACAACGCCGC TCGGTGCGAG CCCCGAATCC 
TTCGCACCGG TCGTGGAACG GCTGGCGGAC GCGCCAGCCG GCGCCGCGGC GTGA

Protein sequence

MGEPSEAHPS PARPIRFNTG PGRISDLAAL REAGQAIEGL GYSTFALADH FMIRYAPLIA 
LQAVADATST LRLTQTVLNQ DLRHPAVLAK ELATLDVLSQ GRLQVGLGAG WMQAEYQQAG 
IRYDPAAARI ARLEEVVIIL KGLFGDDPFS YSGANFTIDA LRGTPRPLQR PHPPIMIGGG 
GRKLLSVAGR HADIVQIMPR LPQEVRPAEP HPFSGEAYEE RIGWVRAAAG DRFGDIELGA 
QLLNVTITDD PEAAFEACFQ SFGRQVRGSS GGAVPSRADL GSSPMVAIGS LDDVCRKILD 
IRDRFGISYF TTPLGASPES FAPVVERLAD APAGAAA