Gene Franean1_3494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3494
Symbol
ID	5671865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4156666
End bp	4158048
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	69%
IMG OID	641242382
Product	nitrilotriacetate monooxygenase component A
Protein accession	YP_001507802
Protein GI	158315294
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.748879
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGCCAA GGCGCGAGGA CCAGCTCACC CTGGTCGCGT TCATGCAGGC TTCGAACGTG 
TCGGTGTACT CGGGGTCGTG GCGGTACCCG AGCTCGGCGC ACGACTTCCT CGACCTCCGC 
TACTACCAGC GGATAGCGCG GGTGCTCGAG GAGGGCACGT TCGACCTGAT GTTCTTCGAC 
GACCGCCTGG CGATGCCGTC GATCTACAAC GCGTCTCCCG CCGACGCCGT CCGCTACGGC 
GCCCGCCCGG TCAAGCTCGA TCTGACCGCG GTGCTGGGCG CCGCCGCGGC CGCGACGTCG 
CACCTGGGCC TCGGAGCGAC CTACTCCACG ACGTACTACC CGCCGTTCCA CGTCGCGCGG 
ACCTTCGCGA CGCTGGACCA CCTCAGCGGC GGGCGGGCGG CCTGGAACGT CGTCACCTCG 
GTGAACGACT CCGAGGCCCG CAACTTCGGG GTCGACCAAC ACCTCGGTCA CGACGAGCGC 
TACGACCGCG CCGAGGAGTT CATCGACGTC GTCACCCGGC TCTGGGACTC CTGGGAGGAC 
GACGCCCTGG TGATGGACCG GGAGTCCGGC GTCTTCGCCG ACCCGGGCAA GGTCCACGAA 
CTCGACCACC ACGGCAAGTA CTTCCACGTG CAGGGACCCC TCACCGTCCC GCGCCCGCCG 
CAGGGCCGGC TGCCCATCAT CCAGGCCGGC CAGTCGGGCC GCGGCCAGCA GTTCGCCGCC 
AGGTGGGCCG ACCTGATCTT CACCGCCGAC CCGAGTCAGA GCGTCGCCGC CGAGCACTAC 
CGCAGCCAGA AGGAACTCGT CACAGCCGAG GGCCGGTCCG CCGACGCCGT CCGGATGCTC 
CCGATGGCGT ACGTCATCGT CGGCGAGACC GAGACGATCG CCAGGGAGAA GGAGAACATC 
TTCCGCGACG AGCTCGTCCA CCCGATGGCG TCGCTGACGC TACTCTCCGA GCTCACCAAC 
CACGACTTCT CGGGTTACTC ACTCGACGAC GAGATCACCG ACGAGCTCAT CAACTCCGTC 
TCCGGCATCC GCGGCCTCGT CCAGGGCGTG AAGAAGCACC TCGGCGGCGG CAAGATGACA 
CTGCGGACGC TGGCGAACCA CCGCGCCACC CTGCTGCAGG GCCCGCGCTT CGTCGGCACC 
GGCACACAGA TCGCCGACCA GATGCAGGAC TGGTTCGAGA CCTACTCCTG CGACGGTTTC 
GTCCTCGCGG CCACCCACTT CCCCGGCGCG TTCGAGGACT TCGTCCGGCT GGTGGTGCCC 
GAGCTGCGCC GCCGCGGACT GTTCCGCTCC CGCTACACCG GCTCGACCCT GCGCGAGAAC 
CTGGGCCTGG CACGGCCCGC CAGCAGCTTC ACCGCGTCGG TCAGCAGCGG TGTCCGCCCC 
TGA

Protein sequence

MSPRREDQLT LVAFMQASNV SVYSGSWRYP SSAHDFLDLR YYQRIARVLE EGTFDLMFFD 
DRLAMPSIYN ASPADAVRYG ARPVKLDLTA VLGAAAAATS HLGLGATYST TYYPPFHVAR 
TFATLDHLSG GRAAWNVVTS VNDSEARNFG VDQHLGHDER YDRAEEFIDV VTRLWDSWED 
DALVMDRESG VFADPGKVHE LDHHGKYFHV QGPLTVPRPP QGRLPIIQAG QSGRGQQFAA 
RWADLIFTAD PSQSVAAEHY RSQKELVTAE GRSADAVRML PMAYVIVGET ETIAREKENI 
FRDELVHPMA SLTLLSELTN HDFSGYSLDD EITDELINSV SGIRGLVQGV KKHLGGGKMT 
LRTLANHRAT LLQGPRFVGT GTQIADQMQD WFETYSCDGF VLAATHFPGA FEDFVRLVVP 
ELRRRGLFRS RYTGSTLREN LGLARPASSF TASVSSGVRP