Gene Francci3_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1863
Symbol
ID	3906138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2197228
End bp	2198688
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	63%
IMG OID	637879201
Product	radical SAM family protein
Protein accession	YP_480968
Protein GI	86740568
COG category	[C] Energy production and conversion
COG ID	[COG1032] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.300057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.908691
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTTC TCCTTATCGC CATGCCATGG CAGGGACTTG ACACACCGTC CAGTGCGCTG 
GGAGTACTCG GGCCTTCCGT CCGCGAACAG GCGCCCGGCT GGTCCGTGGA CGAGTTGTAC 
GGAAACTTCC GGTGGGCTGA GCACCTGATG TGCGCTAGCG GCGGAGCCAT CGGCGTGGCG 
GACTACGGCA AGGTGGCGGT CCAGGTCTTT CAGGGCGTCG GCGACTGGGT CTTCGCTCCC 
GCGCTGTATG ACGTCGCGAG CTACCGTGTC GACGAGTACG CGCAGCTTCT CGACGCGCAG 
GGTGTCGACG CGGAGGTTCC CGTCGAGATG CAGCGACACT CCCGGACGTT CATCCGGCAG 
CTGGCGGCCG AGATCGCCGC CGATCCACCG GACATCGTCG GATTCACCAG CACTTTCATG 
CAGAACGTTC CGTCACTCGC GCTCGCGAGG GAGATCAAGA GAGTCGCGCC GGGCGTCCTC 
ACGGTGATCG GCGGCAGCAA CTGCGACGGG CCGCAGGGGC CGGCCCTGCA CCGGAACTTC 
GATCAGCTCG ACTTCGTGAT CAGTGGTGAA GGCGAACGGT CGCTGCCCGC GCTGCTGAGG 
TGTGTCGCCG CAGGTGCGAG TGTCGCCGAC ATACCCGGCC TCAGCTGGCG GTCCGACGGG 
ATGACGGTCA CGAACCCACC CGCCGAGTCG TCCGTGCCCT TCGGCGTGGT GCCAGCCCCC 
GACTACGACG GCTACTTCCA GGCGCTCGAG AATTCGTCGC TCGGCCCCGG CATCCGGCCG 
ATGGCGGTTC TCGAGACATC CCGTGGCTGT TGGTGGGGCG AAGTTCACCA GTGCACCTTC 
TGCGGCCTGA ACGGATCGAA CATTAACTTT CGGAGCAAGG CTCCCGAACG CATCGCGCAC 
GAGGTCCGGG ACCTGGCGTC GAGGCACCGC GTTCTCGACG TGGTGATGGT CGACAACATT 
CTCGACATGG GCTACATCGA TAAGGTGATG CCGGAGCTGG CGGCCCTCGA CTGTGATCTG 
AGGATTCACT ACGAGATCAA GTCGAACATG ACCCGCGAGC AGCTGGGCCG CCTGAGGGAC 
GCGAACGTGC TCTTCGTCCA GCCGGGCATC GAGAGCCTGA GCAGCCACGT GCTTCGGCTG 
ATGGAAAAGG GCGTGAGTTC GGCGCACAAC GTGCGTATGC TGCGAGATGG CATGGATCTC 
GGCCTGAGCG TCACCTGGAA CATCCTGTAC GGATTCCCTG GGGAGACCGA CGAAGATTAT 
CAGAGCCTGC TGAGGAAAAT GGCATCACTG GAACACCTCC AGCCGCCAAC CGGCGCGTGG 
CGCATTGCAC TGGAGAGGTT CAGTCCCTAT TTCGATGATC CTTCCATTGG ATTCATGTTC 
CGCACGCCGG CGCGCTTCTA TGAACTTATC TATAATGTTC CAAAAGGCGA GTTGTATGAT 
CTCGTCGTAA GAGTTCGGTG A

Protein sequence

MRLLLIAMPW QGLDTPSSAL GVLGPSVREQ APGWSVDELY GNFRWAEHLM CASGGAIGVA 
DYGKVAVQVF QGVGDWVFAP ALYDVASYRV DEYAQLLDAQ GVDAEVPVEM QRHSRTFIRQ 
LAAEIAADPP DIVGFTSTFM QNVPSLALAR EIKRVAPGVL TVIGGSNCDG PQGPALHRNF 
DQLDFVISGE GERSLPALLR CVAAGASVAD IPGLSWRSDG MTVTNPPAES SVPFGVVPAP 
DYDGYFQALE NSSLGPGIRP MAVLETSRGC WWGEVHQCTF CGLNGSNINF RSKAPERIAH 
EVRDLASRHR VLDVVMVDNI LDMGYIDKVM PELAALDCDL RIHYEIKSNM TREQLGRLRD 
ANVLFVQPGI ESLSSHVLRL MEKGVSSAHN VRMLRDGMDL GLSVTWNILY GFPGETDEDY 
QSLLRKMASL EHLQPPTGAW RIALERFSPY FDDPSIGFMF RTPARFYELI YNVPKGELYD 
LVVRVR