Gene Francci3_2841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2841
Symbol
ID	3904753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3347359
End bp	3348711
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	66%
IMG OID	637880162
Product	zeta toxin
Protein accession	YP_481928
Protein GI	86741528
COG category	[S] Function unknown
COG ID	[COG4185] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.21799
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCAGGCG CTTCTGAATA CGATACCGTT GGCCCGGTCA CGAGAATGGC TCTCTTCTGC 
CCCGGGAGCG TCCATGGCTG TTCGCCGGTC TCCGGCCAGG TTACCGCGGT GACTCCGGCC 
GAGTTCCGTG GCCTCGAAAC CGCCCCGGAA CGACCCGACG CAGGCGGTGG GCCGGTCCCG 
GAGCAGTCTC GGGTCACCGA GATCGACAGA AAGCTCGACC TGCTGGACCG CGCCGCCTCC 
CCGGGCGACT CACCCGAGCC CCGCCATCAG GAGCGACCGG CCGGCCGGGA TGCTCCCAGC 
CGGAACACCT CCAGCATCGA CGCCAAGCTG GACCTTCTCG ACAGGGCGGC GCTCGCCCGT 
TCCGGCGGCG GCGCGGCTAC GCCGGCGGAC ACCACCGGCG ACCGGCCGTC CGAGGTCCGC 
CCGCCCACCG AGCCCGGGAA CAGCGACCGG GCTCGGACCG AGGCCAAGCT GGCGCTGTTG 
GAGGACGCGG CCCGCCGCTA CCGCCCCGAG CCCCCGGACG CGCCCGCCCC CGGTCGGGAG 
CGCTGGGCCG TCCGCGAGGC ACCGCGGACT CTGCCGGACG ACCATCCGCT CCTCACCCCG 
ACGGACACCA TCAACACCCC CGAACGCGCC GCCCTCCGGG AGAATCTGGT GAAGGAGGTG 
ATCGGCGATG CCAAGCCGCC GGAGCAGGGC AGCCCCACCC TCGACCTCAT GGGCGGCGGC 
GGAGCCTCCG GCAAGGGCTT CGTGCTGGAG TACCTCAAGG ACGAAGGCCA AGTACCCACC 
GAGAACGTAG TCCATCTTGA TCCCGACGAG ATCAAGAAAA TGATCCCCGA GTTCGACGAG 
ATCATGGGTG CAGGAGACTC GCGCGCGGCT GAGGTGGTCC ATGAAGAGAG CAGCTCACTC 
GCGAAGGGAG TCCTTCAACA GGCCATGGAC CGCCGCCTCA ATATCATCTA CGATAGCACC 
CTCGGCAACC CGGAGAAGAC CGCCAAGCTG ATCGATGACG CGCATGCGAA GGGATACGAG 
GTTCGCCTAT TCGGGGTGAG TGCCGATCCG GAGCTCGCGG TCACGCGCGC CGCGGACCGC 
GCCGCAAAGT CCGGCCGCTA TGTTCCCGTT GACCACCAGC TTGCGGCACA CCGTGGATTC 
TCCCAGGGCT TCGAAGGTTA TGCCGAGAAG GCCGATAAAG TACGTCTTTA TGACACCAAC 
TCTGAACCCC GACAGATCGC CCGCAAGAGG GCGGGCGAAA TTTTGACAAT TCTCGACCAA 
GGATCGTACG ATAAATTTCA AAATAAAATA AACATTAATC CAGAAGCCAT GGGGCCGACA 
TCACTGTACA CCGATCGAGG CGAAAACCAA TAA

Protein sequence

MPGASEYDTV GPVTRMALFC PGSVHGCSPV SGQVTAVTPA EFRGLETAPE RPDAGGGPVP 
EQSRVTEIDR KLDLLDRAAS PGDSPEPRHQ ERPAGRDAPS RNTSSIDAKL DLLDRAALAR 
SGGGAATPAD TTGDRPSEVR PPTEPGNSDR ARTEAKLALL EDAARRYRPE PPDAPAPGRE 
RWAVREAPRT LPDDHPLLTP TDTINTPERA ALRENLVKEV IGDAKPPEQG SPTLDLMGGG 
GASGKGFVLE YLKDEGQVPT ENVVHLDPDE IKKMIPEFDE IMGAGDSRAA EVVHEESSSL 
AKGVLQQAMD RRLNIIYDST LGNPEKTAKL IDDAHAKGYE VRLFGVSADP ELAVTRAADR 
AAKSGRYVPV DHQLAAHRGF SQGFEGYAEK ADKVRLYDTN SEPRQIARKR AGEILTILDQ 
GSYDKFQNKI NINPEAMGPT SLYTDRGENQ