Gene Franean1_5726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5726
Symbol
ID	5674052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6954941
End bp	6956185
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	66%
IMG OID	641244579
Product	radical SAM domain-containing protein
Protein accession	YP_001509982
Protein GI	158317474
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.559875
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGGCC CCCTCGGCAC CGCCTATGGA GATCCGTCGG ACGAATGGCC CGCCAACGAG 
CTCGACTTCC ACCGGCTGAC CGCCGCGGGA TGGCGGCCCA CGCCCTTCCG CCAGATCGTC 
CTCAAGATCA ATAGCAGATG CAATCTGTCC TGCACCTACT GTTATGTCTA CCACCAGGCC 
GACCAGAACT GGCGGCAGCA GCCCGTCACG ATGAGCCCGG CGGTGGTGGA GGCCACGGCA 
CGCAGGCTCG CCGCACACGC AAAGACGCAC GAACTCCCAT GGATGCAGAT CATCCTGCAC 
GGCGGTGAGC CGCTCCTGGC CGGCCACGAC CACCTCCGGA ACGTCGCGGA GCGTCTGCTC 
GCCGCGGTCG GCACTGACAC CGCCGTGGAG TTCGTCCTCC AGACCAACGG CACTCTGATC 
GACGAGGTGT TCCTCGAGCT CTGCCAGGAG TTCCGCATCC AGGTCGGGGT CAGCGTCGAC 
GGCGATCTGG CGGTCAACGA CCGGCGCCGG ACCCGTCGCA ACGGGAGTGG GAGCCACGCC 
GAGATCGCCC GAGGCCTGCA CCTGCTCACC TCGGAACGTT TCCGGTCGAT CTTCTCCGGG 
CTGCTCTGTG TCATCGACCC CACGAGCGAT CCGGGAGAGG TGTACGAGAG CCTGCTGGCA 
TGGCGGCCAC CGAGCGTCGA CTTCCTCCTT CCGCACGGGA ACTGGACGGC CCGCCCACCG 
GCCCGGGACA GCGACGAGAC GTCAACGCCC TACGCCGACT GGCTCGGCAT GGTGTTCGAC 
CGTTGGTATC CGGCCCCCAG CCACGAGACG GACATCCGCC TGTTTCTGGA GATCATCTCG 
CTGATCCTCG GCGGCCACAG CCGCATCGAG ACGGTCGGTC TCTCGCCCTC GTCCGTCGTC 
GTCGTCGAGA CCGACGGCTC GATCGAACAG GTCGACGCGC TCAAGTCCGC CTATCACGGC 
GCGGCATCCA CCGGCCTCAC CGTTACGCGC AATGACCTCG ACGAGGCGCT GCGCCATCCA 
GGTATCCTTG CCCGGCAGAT CGGCGCCGCC GCGCTCGGCC GCGAGTGCAC GCGATGCCCG 
GTGCACCGCG TGTGCGGAGG TGGATATTAT CCCCACCGGT ATCAGGCCGG CAGCGGCTTT 
CGGAACAGAT CCGTCTACTG CCCGGATCTG TTCGCACTGA TCACACGAAT CGGCAAACAG 
ATCCGGGCAG ATATCGAAAA GGCAAAGCCG CAGGGTGAAC ATTGA

Protein sequence

MIGPLGTAYG DPSDEWPANE LDFHRLTAAG WRPTPFRQIV LKINSRCNLS CTYCYVYHQA 
DQNWRQQPVT MSPAVVEATA RRLAAHAKTH ELPWMQIILH GGEPLLAGHD HLRNVAERLL 
AAVGTDTAVE FVLQTNGTLI DEVFLELCQE FRIQVGVSVD GDLAVNDRRR TRRNGSGSHA 
EIARGLHLLT SERFRSIFSG LLCVIDPTSD PGEVYESLLA WRPPSVDFLL PHGNWTARPP 
ARDSDETSTP YADWLGMVFD RWYPAPSHET DIRLFLEIIS LILGGHSRIE TVGLSPSSVV 
VVETDGSIEQ VDALKSAYHG AASTGLTVTR NDLDEALRHP GILARQIGAA ALGRECTRCP 
VHRVCGGGYY PHRYQAGSGF RNRSVYCPDL FALITRIGKQ IRADIEKAKP QGEH