Gene Franean1_3201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3201
Symbol	moaA
ID	5671577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3779991
End bp	3780986
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	71%
IMG OID	641242095
Product	molybdenum cofactor biosynthesis protein A
Protein accession	YP_001507515
Protein GI	158315007
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2896] Molybdenum cofactor biosynthesis enzyme
TIGRFAM ID	[TIGR02666] molybdenum cofactor biosynthesis protein A, bacterial

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCTCG CCGACTCGTA CGGGCGAGTC GCGACCGACC TACGGGTGTC GCTGACCGAC 
CGTTGCAACC TGCGTTGCAC CTACTGCATG CCCGCCGAAG GCCTGGCCTG GCTGCCGCGG 
CCGGAAATCC TCACGGACAG TGAGGTGTTA CGCCTGGTCG CGATTGCGGT GACAAGGCTC 
GGGGTGACCG AGATCCGGTT GACCGGGGGC GAGCCCACAC TGCGGCCGGG GCTGGTGTCC 
CTGGTGCAGG CGATAACCGC CCTGGTACCG CGGCCGGAGG TGGCGCTGAC GACGAACGGC 
CTGCTTCTGG GCGGCTCCGG AGGGCTGGCC GGAGCACTGG CGGCGGCAGG CATGGACCGG 
GTGAACGTGT CGCTGGACAC GCTGCGTCCG GACCGGTTTG GTGAGATCAC CCGCCGTCAC 
CGCCTGGACG ACGTGTTCGC GGGTCTGGAA GCCGCGGCAC GGGCGGGATT CGCCCCGGTG 
AAGGTGAACG CGGTGCTGAT GCGGGGAGTC AACGACGACG AGGCCGTCCC GCTACTGCAC 
TGGTGCCTGG ACCGAGGCTA CGAGCTGCGG TTCATCGAGC AGATGCCGCT CGACGCCCAG 
GGCGGCTGGC GACGGGAGCA GATGGTGACC GCGGCGGAGA TCTTGGACCG GCTGGCCGCG 
GAGTTCACCC TCACCCCCGC ACCCGGGCGC GGCAACGCGC CGGCCGAACT TTTCACGATC 
GACGCGGGCC CCGGGCAGGT CGGGGTGATC GCCTCGGTGT CGGCGCCGTT CTGCGCGGCG 
TGTGACCGAG TCCGGCTCAC AGCTGACGGG CAGGTACGCG ACTGCCTGTT CGCCCGGACC 
GAGTCGGATC TGCGGACCCC CCTGAGGTCT GGGGCTGACG ACGAGGAGAT CGCGGCCCGG 
TGGGTGCGGG CGGTGCGGGC GAAACGGGCC GGGCACGGCA TCGACGTCCC CGGATTCGTT 
CAACCGGCTC GTCCCATGTC CGCCATCGGC GGGTGA

Protein sequence

MQLADSYGRV ATDLRVSLTD RCNLRCTYCM PAEGLAWLPR PEILTDSEVL RLVAIAVTRL 
GVTEIRLTGG EPTLRPGLVS LVQAITALVP RPEVALTTNG LLLGGSGGLA GALAAAGMDR 
VNVSLDTLRP DRFGEITRRH RLDDVFAGLE AAARAGFAPV KVNAVLMRGV NDDEAVPLLH 
WCLDRGYELR FIEQMPLDAQ GGWRREQMVT AAEILDRLAA EFTLTPAPGR GNAPAELFTI 
DAGPGQVGVI ASVSAPFCAA CDRVRLTADG QVRDCLFART ESDLRTPLRS GADDEEIAAR 
WVRAVRAKRA GHGIDVPGFV QPARPMSAIG G