Gene Francci3_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1147
Symbol
ID	3903575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1362773
End bp	1364212
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	71%
IMG OID	637878479
Product	hypothetical protein
Protein accession	YP_480255
Protein GI	86739855
COG category	[S] Function unknown
COG ID	[COG5361] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.294682
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCGA GTGACCATCG GCTCGGGCTG GCGGCCGAGG CGTTCATCTT CGGATATCCC 
CTGGTCAGCA ACGTCCGGCT GAGCGTACGG ACGGCGGCTG AGGGAATCGG GCCAATCCGG 
CCCGCCGGGT ACAACGCCTT CGCTCACGAG ACGGAACCGC CCGCGCCACT GTCCTGCTTC 
GTCAGCGTCG ACAACGACGC CCTGTGCTCG GTGGCCGAGG TCGACCTCAC GCCGGGTCCG 
CTGGTCCTGC GGATCCCCGA CACGCCGGAT CGTTACAGCG TTATGATCTT CATGGACGCC 
TGGCGGAACA ACTTCGCCTA CGTGGGACGG CGAACCACCG GCGGACGAGG TGGGCGCTAT 
CTGCTCGTCC CGCCGGGCTG GACGGGCAGC GCGCCCGCGT CGCTGGCCCG CATCGAGGCA 
CCGACCCGGC TGCTGACGCT GATCAACCGG TTCGGCTTCG ACGGCCCGGC GGACATCGCG 
GCGGTGTCCC GGCTGCAGGA GGAACTGGAC CTGAGCCCGC TGGATTCCGA GGCCCGCCGC 
GCGGAGGGAC CGCCGGAACA CTCGAAGAGG GTCTGTGACG ACCTCCGGTT CTGGGAGGAG 
CTACGCATCT GGCTGCGCGC CTATCCTCCG TCGCGGGCCG AGGCCGAGTA CGCCCGCCAC 
TTCACCTCAC TCGGGATCCT CGACGATCCT TCGCCGTACG TCGACCCCAA CCCGGGCCTC 
GCCTGGTCCC TGCGCACCGG GCTGCGCGCC GGCCGCGACA AGCTCGAACG GGTGGCGCAC 
GCCGGCCGGG CGCTGACGAA CGGCTGGGTG AGCACCCCGC ATGCCCTCGA CTTCAACCTG 
GACCGACTCG GACCGGGCAC GATCGACGAT CCGGCCTGGC GGATAAGCGA TCGGGCACAG 
GCCCGTCTCG CCCGGGCGAT GGCCGCCCGA CTGCCGCGGG GTGCGACACA CGGCTATGAG 
GAGATCCAGG CGAGCCGTGC CATCGACACG GACGGCCGCC AGCTGAGCGG GGCCCACCGG 
TACCTGCTGG AGCTGGTGCC GCCGCCGCAG GCCGCGTTCT GGTCGCTGAC GATGTACGAC 
GCGCCCGAGT ACTACCTCGT CGAGAATCCC CTGCACCGGT ATTCCCTGCG GAGCGGCGAC 
CGCGATCTGC GCCGCGGTCC GGACGGCTCG GTGCGCATCC TGCTCCAGAG TGATCCCCCG 
GAGGACGGCG GGCCGCTTGA CAACTGGCTG CCCGCGGCGG TCGGCGATTT CCGGCCCGTC 
CTACGGATCT ACGAGCCGGG GGCCGACGTC CTCGACGGAA CGTACGTGCT CCCTCCCATC 
CGCCGCATCG ACCGATCACC GGGCCAGCCG ATCATCAGGA CGACCGTTCA CCGGGGCGTC 
GGGGCGCCGG GGCAGGCAGG TCACCCGGGC GGGCAGGTCA GCCTCGACGA TCATCGATGA

Protein sequence

MLASDHRLGL AAEAFIFGYP LVSNVRLSVR TAAEGIGPIR PAGYNAFAHE TEPPAPLSCF 
VSVDNDALCS VAEVDLTPGP LVLRIPDTPD RYSVMIFMDA WRNNFAYVGR RTTGGRGGRY 
LLVPPGWTGS APASLARIEA PTRLLTLINR FGFDGPADIA AVSRLQEELD LSPLDSEARR 
AEGPPEHSKR VCDDLRFWEE LRIWLRAYPP SRAEAEYARH FTSLGILDDP SPYVDPNPGL 
AWSLRTGLRA GRDKLERVAH AGRALTNGWV STPHALDFNL DRLGPGTIDD PAWRISDRAQ 
ARLARAMAAR LPRGATHGYE EIQASRAIDT DGRQLSGAHR YLLELVPPPQ AAFWSLTMYD 
APEYYLVENP LHRYSLRSGD RDLRRGPDGS VRILLQSDPP EDGGPLDNWL PAAVGDFRPV 
LRIYEPGADV LDGTYVLPPI RRIDRSPGQP IIRTTVHRGV GAPGQAGHPG GQVSLDDHR