Gene Francci3_4234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4234
Symbol
ID	3907200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	5051912
End bp	5053312
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	72%
IMG OID	637881560
Product	hypothetical protein
Protein accession	YP_483309
Protein GI	86742909
COG category	[S] Function unknown
COG ID	[COG1944] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03604] bacteriocin biosynthesis docking scaffold, SagD family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGATCAA CCACCCCCGC GCCGGCCGAA CGGCGTCTCG TCGACCGCCG ACTCGGCGTC 
CTCACCCAGA TCGTTCCCTA CCAGCCGAGC CCCGCCATGC CGCGTTGCTG GGTCGGCTGG 
AGCGCCCGTG CCGCCGACAC CCGTGCGTTC GCCACCTGGT CGGCCGAGCG GTTTGGCTTC 
GGTGCCGCCC TGGGCGATCA CGACCGGGCG CGCCGTGCCG CGGTCGGGGA GGCCGTGGAA 
CGGTACTGCG GCAACGCCGT TCCCGACGCC CTGGAGATCG CCTGCTACGA CGATCTCGCC 
AGGGCCGGGC GGCCGGCTCT CGACCCGGCG ACCCTGGCGC TCTATTCCGA CCGGCAGTAC 
CGCGCCCGCG GGTTCCCCTT CCGGCCCTTC ACCCGCCAGA CACCGGTGGC CTGGGTGCCC 
GGCCGCGACC TGTACGCCGG GGGTCCGGTG CTGGTGCCCG CGTCGATGGC CTACCTGAAC 
TACTTCCGCG GCGCGCACGC CGACGAGGTG GCCACCCACG CCATGCTGTA CGCCGGCATC 
GCCACTGGCG AGAACCGTGA GCACGCCGAG CGTTTTGCGT TGGAAGAGCT CTTCGAACGC 
GACGCGAACA CCATCTGGTG GGCCAGCGGC GCCGCCGGCT GGGCCGTCGC CGATGCGGCT 
GAGCTCCTCG ACCGGTACGA CATCGCCCAC GGAGAGGGCA CCGGTCGCAC CATCCGGTTG 
TTCCAGGTGC CAAGCCAGTT CCCGGTTCCG GTGCTCGCCG CCTTCCTTGA AGAACCGGGA 
CGGGGGTTGA TCGCGTACGG CACGGCATGC CGGGCGGATC CGCGGGAAGC GGCGACGAAG 
GCGCTCGTCG AAGCCTTCGC CATGCTGGAA CTGACCGCCG AGCTCGCGGA CGGTGACAGC 
GCGCACTGGC GAGCCGTCGC CCGCGGCGAG ATACCCCCGC ACACGTACCT GCCCTACCGC 
GCCGACCGGC GGTACGCGGA TGACATCCGG CCGGATTTCC GCGACCTCGT CGACCTGCCC 
GCGGTCGCCC AGCTCTATCT GGATCCACGA ATGCAGGGCC GGCCCCTCGA CCGGCTCCGC 
GACGACACCC GCACCACCCG GCTCGCCGAC ATCCCCCGGG CCGACGGGGA CGCCAACGGG 
GGCACAGCCC ATCGACGCTA CCTCGACATG CTCGCGACGC AGGGCCTGTC CGCCGTGTCA 
GTGGACGTCA CCACTCCGGA CGTGCGGGCG GCCGGCCTCA CCGTCGTGCG GGTCATCGTC 
CCCGGGCTCT ACGGCAACCC GCCCGCGGCC TTCCCGTTCC TCGGCGGCGA GCGGCTCTAC 
GACGTACCCG CCCAGCTGGG CCTGGCTGCC GGAAAGATCA CCGAAGACGC CCTTTATCCG 
TACCCGATCC CGCACGTCTG A

Protein sequence

MRSTTPAPAE RRLVDRRLGV LTQIVPYQPS PAMPRCWVGW SARAADTRAF ATWSAERFGF 
GAALGDHDRA RRAAVGEAVE RYCGNAVPDA LEIACYDDLA RAGRPALDPA TLALYSDRQY 
RARGFPFRPF TRQTPVAWVP GRDLYAGGPV LVPASMAYLN YFRGAHADEV ATHAMLYAGI 
ATGENREHAE RFALEELFER DANTIWWASG AAGWAVADAA ELLDRYDIAH GEGTGRTIRL 
FQVPSQFPVP VLAAFLEEPG RGLIAYGTAC RADPREAATK ALVEAFAMLE LTAELADGDS 
AHWRAVARGE IPPHTYLPYR ADRRYADDIR PDFRDLVDLP AVAQLYLDPR MQGRPLDRLR 
DDTRTTRLAD IPRADGDANG GTAHRRYLDM LATQGLSAVS VDVTTPDVRA AGLTVVRVIV 
PGLYGNPPAA FPFLGGERLY DVPAQLGLAA GKITEDALYP YPIPHV