Gene Franean1_4538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4538
Symbol
ID	5672887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5414382
End bp	5415458
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	66%
IMG OID	641243403
Product	putative ammonia monooxygenase
Protein accession	YP_001508819
Protein GI	158316311
COG category	[R] General function prediction only
COG ID	[COG3180] Putative ammonia monooxygenase
TIGRFAM ID	[TIGR03082] membrane protein AbrB duplication

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGAGAG ATGCTCTGGT CGCAGAGAGC AAACGAGGTT TATGTGGCGT AATCATCCTA 
GTCGCCGCAA CGATACTGAT GCATCTGGTC CACTCGCCAT CTCCGTATCT TCTCGGTGGC 
CTGATCGGCG GTGCCGCGTT CTCGCTCGCG TTCGGAGCGC CATGGCGGTT TCCTGAGCCG 
GCACGGCATT TCGGCATGGC GCTGATCGGG GTCAGCGCGG GCGCGCTGAT CGACTCCGAT 
GTGATCCGGC GGATAGCCAG CCAGCCCGTT GAGGTACTCG GGGGTGTCGC CGTCACACTG 
GTCTTTTCGA TGGCGACGGG CCTGGTTCTC GTTTTGTCGC CGAAGGTCAA CCTGGCCACG 
GCGGTCTTCT CCTCGATGGC GGGCGCTGCC TCCGGCGTGT CGGCCATGGC CAAGGAGCTG 
GATGCCGACG ACGCGATCGT CTCGGCCGTC CAGTACGCGC GCGTGGTGGT TGTCGTGGTT 
TCGCTGTCGC TGGTTGCGCC GATCCTCGAC CGCTCCGGGA GTCTCTCGCC GGCCGATCGC 
GGGCCCGCTG CCGTCGAACC CGTCCTGTGG CAGAGCCTCG TGTTCACGGC ACTGTGCATG 
GGAGTCGGCC TGCTCCTCGC GCAGGTCCTT TCCTTCAGCG GCTCGCGGTT GGTCGTCCCG 
ATGCTGCTCT CGATGGCGGT TGCGCTGGTG GTCTCCGTCC CGCTTGCCGT CCCGGAGCCG 
CTGCTCGATC TCGGTTACAC CATCACCGGG CTTGCCGTTG GGTTTTCTTT CACTGCGGCC 
ACGATCCGCC TGTTGATACG GCTGTTCCCG TTGGTGCTGG TGCAGTTGGT TCTGAGCGTC 
GGGGGCTGCG CCGTGATCGG AATCGTGTTC GCCCGGGCGG TCGGAATTCC GGACCTCGCT 
GGATACCTGG CGATGACCCC GGGCGGTCTC CCGGCGGTGA CGGCTGTCGC GGTCCAGTCC 
GGCGCGGAGG TCGGACTGGT CATCACGATG CAGCTCGTAC GGGTGTTCGC CGCCATCCTG 
AGCGCGTCAC TCATCGGCAC CCTGGTCAGG CGCCGGAGCC GGCTGACGGG TGCCTGA

Protein sequence

MQRDALVAES KRGLCGVIIL VAATILMHLV HSPSPYLLGG LIGGAAFSLA FGAPWRFPEP 
ARHFGMALIG VSAGALIDSD VIRRIASQPV EVLGGVAVTL VFSMATGLVL VLSPKVNLAT 
AVFSSMAGAA SGVSAMAKEL DADDAIVSAV QYARVVVVVV SLSLVAPILD RSGSLSPADR 
GPAAVEPVLW QSLVFTALCM GVGLLLAQVL SFSGSRLVVP MLLSMAVALV VSVPLAVPEP 
LLDLGYTITG LAVGFSFTAA TIRLLIRLFP LVLVQLVLSV GGCAVIGIVF ARAVGIPDLA 
GYLAMTPGGL PAVTAVAVQS GAEVGLVITM QLVRVFAAIL SASLIGTLVR RRSRLTGA