Gene Francci3_3375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3375
Symbol
ID	3905957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4004941
End bp	4006863
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	68%
IMG OID	637880698
Product	radical SAM family protein
Protein accession	YP_482459
Protein GI	86742059
COG category	[R] General function prediction only
COG ID	[COG0535] Predicted Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.131592
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCAAT CTTTGCCGGG AGACAACCCT GCTCTCCACC GACAGTTCCC GACGGCGTTC 
CCGCACTTGT CGAGATCGCT CGTTCGCGGC CGAATCCGCC CAGGTAAAAG CAATGGGTTT 
GGGGGAATTT TGGAACAGGT CTATCCGCAT ACCGGGGTGT GCTACACCTA CGGGAACCAC 
GAGCGCGTGT ACCTGATCTA CACCTATGCC TGCAACGCGA CCTGCGCACA TTGCCTGGTC 
CAATCGAGTC CACATCGCCG GGAGAGGTTC GACCTGGCCA CCGCGATAGA AATCCTGCGG 
ACGGCAGCCA GGTTCGGTCG CAGGTTCCTC GACCTGGGCG GCGGCGAGAT CATGCTTCAT 
CCGGAGGACA CCTGTGCGCT CGCCCGCGCC GCCACGGATC TCGGGTACTA CGTCTCCCTC 
AACACGAACG GCTTCTGGGC CCGCACCCCC GAACGCGCCC GTACGCTCGT GAGCCGTCTC 
CAGCAGGCCG GGGTCCAGGC GATCTTCCCG AGTGCGAGCG CCTTTCACCT GCCGTTCGTG 
CCGGTCGAGC GGCTGCGCCA CCTCCGCCGG GCCTGCGCCG ACCTCGGCAT GGTGCACGAG 
CTGAGCTGGG TGGCCTCCCA CCTGCCCGAC GTGGACGCCC AGCTGCTGGA CGACCTGGAC 
CTGGGCGGTG AGACGGTCTA CCCCAACAGC CTGACCACCG AGGGCAACGA CCCGGAAGTC 
ATGGCGGCTC TCACCAGGCA CTACAGCCGG TTCACGCCGG ACCGGCTCCC CGACTGTGGA 
AGTCTGCAAC TGGGCGTCAA CCCGCGCGGG CATGTGATAG CCACCTGCGA GATGACCAAT 
CTCAACGAGA AGTTCCGCGG CACCGCACTG TTCATCGGAG ATTTCACCCG GACGCCGTTC 
GAGCAGCTCC TGGAAGCCGA ACGGGACACG GCCGTGCTGC AGTTCCTCTA TCATAACCCG 
CCGGCCGCGC TGCACGATCT GCTGCTCGCC GATCCGCAGG AAGGCGGGGG ATACCGGCAC 
CGGTATGCGG ATCGCACCTA TCACAGCGTC ACGGACTACC TCGCCGACCT GCTGCGCGAC 
GAGAACGTGC CGGCCGCGGA GCGCGCCATC GCCCGCGCGT CCGATACCCG CGCGTCCCAT 
GCCAGCGCGT CCCATGCCAG CACAGCGGTT CCCGGCAGGT TCCACCCGGT GATCTCCCGC 
GCGTCCCCAC GTCTAGACCC CGCCGGGAAC CGCCGGCCCG CCGGTAATCC GCGATCCGAT 
TCAACGCCTG GTCGAGAGGA ATTCATCGAT GGCGGAGAAA ACGCTAACCT CCAGCTCTTT 
TCGTCTCCGT GTGGACCTCC TGGCTCCCCA CATCATGTCG GCCATGGAGG CTTTCGACGC 
CGCCACCGAC AAGGTCAGCC TGCCGGCCTC GCTCCTGGAA CTGGTCCGCA CCCGGGCCTC 
CCAGATCAAC GGGTGCGCCT TCTGCGTCGG CGCCCACAGC CCGGCCGCCC TCGAGGCCGG 
CGCGACCCAG AAGCAGCTGC TGGCCCTGCC CGTCTGGCGC GAGTCGCCGC ACTTCTCGGC 
ACAGGAACGT GCGGCGCTGA CCCTCACCGA GGCCATCACC CAGATGGACC GCCGGCCGGT 
CACGGACGAG ATGTGGGGCG AGGTCTCGGT GGTCCTCACC GAGGTGGAGC TGGCCGAACT 
GGTCTGGGTG ATCGCGGCGA TCAACGTCTG GAACCGCGTC GCCGGTACCG CGCGTCCCTG 
GCCAGTGGCC TGACATGCGG ATCGGACTCG TCGGGGCCGG CCGAATCGGC GCCGTGCACG 
CCCGCACGCT GGCCGACGAC CCCCGGGTGG ACGAACTGGT CATCACCGAC GTCGACCAGG 
AGCAGGCCGC CCGCGGGGCG AGCGCGGCCG GGGCCCGGGT CGCGGCGGAT CTCGAGGCGC 
TGA

Protein sequence

MTQSLPGDNP ALHRQFPTAF PHLSRSLVRG RIRPGKSNGF GGILEQVYPH TGVCYTYGNH 
ERVYLIYTYA CNATCAHCLV QSSPHRRERF DLATAIEILR TAARFGRRFL DLGGGEIMLH 
PEDTCALARA ATDLGYYVSL NTNGFWARTP ERARTLVSRL QQAGVQAIFP SASAFHLPFV 
PVERLRHLRR ACADLGMVHE LSWVASHLPD VDAQLLDDLD LGGETVYPNS LTTEGNDPEV 
MAALTRHYSR FTPDRLPDCG SLQLGVNPRG HVIATCEMTN LNEKFRGTAL FIGDFTRTPF 
EQLLEAERDT AVLQFLYHNP PAALHDLLLA DPQEGGGYRH RYADRTYHSV TDYLADLLRD 
ENVPAAERAI ARASDTRASH ASASHASTAV PGRFHPVISR ASPRLDPAGN RRPAGNPRSD 
STPGREEFID GGENANLQLF SSPCGPPGSP HHVGHGGFRR RHRQGQPAGL APGTGPHPGL 
PDQRVRLLRR RPQPGRPRGR RDPEAAAGPA RLARVAALLG TGTCGADPHR GHHPDGPPAG 
HGRDVGRGLG GPHRGGAGRT GLGDRGDQRL EPRRRYRASL ASGLTCGSDS SGPAESAPCT 
PARWPTTPGW TNWSSPTSTR SRPPAGRARP GPGSRRISRR