Gene Francci3_2361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2361
Symbol
ID	3904568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2735443
End bp	2737239
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	76%
IMG OID	637879691
Product	hypothetical protein
Protein accession	YP_481457
Protein GI	86741057
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3505] Type IV secretory pathway, VirD4 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.210389
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.401092
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGGCC GCGGGCCGGT CCTGCCCTGG GTGATCCTCG GCGGCCTGTG GGGCAGCATC 
GGCGTCGGCT GGCTGGCATG GATGACCGTC CGCCTGGCGG CCGTCGTCGG GGGCGGCCAT 
CCACCGGCGT TCGGCGCGTT CGTCACCGCC GTGCTCGCCG GCGACGCCAC CCGGGCCACC 
GGCGCAACCC CGGCCGGGTG GGTTGTGGTG TTCGCCGTGC TGGCCCTCGC CGCCGCCACC 
GCCCTGGCCG TCGTCGCCGT GCGCGCCGTG CGCCGGGCAC GGCGGCGTCG GCGCCGCTCG 
GCACCCTGGC GGCTTGCCCT GCCCTCCCTC GCCGACCCGG CCGACCTGGC CACGCTCACC 
CCTGCCGGCG CCGCCGACCG TGCCCGCGCG CTGCGCCCCT CCCTGTCGGA TGCCGATGCC 
CGCCGGCTCG GTGACGACGC CGGCCTGCTC CTCGGTGACC TGCTGCCCCG CGGGCTGCCG 
CTACGCGCAT CCTGGGAGGA CGTGCTCCTG GCGGTCATGG CTCCCCGGGC CGGGAAAACC 
ACGGCGCTGG CGATCCCGAT GACCCTCGCC GCGCCGGGCC CGGTACTCGC CACCGGCAAC 
AAGGCCGACC TGTGGGCCGC CACCGCACAG GTGCGGGCCG GCGACGGCCG CCGGGTGTGG 
ACGTTCGACC CGCAGGCCAT CGCCCACGCC CCCCAGACCT GGTGGTGGAA CCCGCTCGCC 
GCCGTGCACG CCGTCGAGGA CGCCGACCGG CTCGCCGGGC ATTTCCTCCA GGAGATCCGC 
GGGGAGAAAA CCGGCGGGGA CTTCTGGCAG GCCGCCGCCG GGGACCTGCT CGCCGCCCTG 
TTCCTCGCCG CCGCCACCAG CGGGCGCACC CTGCTCGACG TCTACGAATG GCTCAACGAC 
TCCGCCAGCC CCGTCCCCGC CGAACTCCTC GCCGCCGGCG GCTACCCGGC CGTCGCCGCC 
GGGCTGCGCG GACGGCAGGC CGGGGCACCG GAAACCCGTG AAGGTGTCTA CGAAACCGCC 
CGCGCCGCCG CCCGCTGCCT GCGTAACGAC CGGATCCTCG CCTGGGTCAC CCCCGGCCAC 
ACCGACCGCC GCCTCGACGT GGCCGCGATC CCGGCCGGCC GCGACGTGCT GCACCTGCTG 
TCCAAGACCG ACGAAGGTGC CGCCTCCCCG CTGGTCGCCG CGCTGACCGA CCAGATCGTC 
CGCGCGGCCG TCGTCGCCGC CGAACGTTCC GGTGGCCGCC TCGACCCGCC GCTCGCCCTC 
GTCCTCGACG AAGCCGCGAA CATCTGCAAG ATCGCCGATC TGCCCGACCT GTACTCCCAT 
CTCGGCAGCC GCGGCATCGT CCCCCTGACG ATCCTGCAGT CCTACCGCCA GGGCGTGCGC 
GTGTGGGGCG AGGCCGGCAT GGACGCCCTG TGGTCGGCGG CCACCATCAA AATCATCGGC 
GCGGGGATCG ACGACCCGCG CCTCGCCGAG GACCTCTCCC GCCTCGTCGG CGACCACGAC 
GTCGACACCA CCTCGGTCAC CCGCTCCGCC CAGGGCGCCT CGTCGACCAT CTCCAGCCGC 
CGCCAGCGCA TCCTGGAGGC CGCCGACATC CGCGCCATCC CCAAAGGCCG CGCGCTGCTG 
CTCGCCACCG GCTCCCGCAT CGCCGCGATC GCCCTGCGCC CCTGGTACAC CGGCCCCCGC 
GCCACCGAGA TCACCGCCGC CATCCGTACC GCCGAAGCCA CCCTGACCGC CCGCGCCACC 
GGCGCCCACC CCGCCGGCGA GGAGGAGACC GATGACAGCC CCCTCACCCA CCTCTGA

Protein sequence

MNGRGPVLPW VILGGLWGSI GVGWLAWMTV RLAAVVGGGH PPAFGAFVTA VLAGDATRAT 
GATPAGWVVV FAVLALAAAT ALAVVAVRAV RRARRRRRRS APWRLALPSL ADPADLATLT 
PAGAADRARA LRPSLSDADA RRLGDDAGLL LGDLLPRGLP LRASWEDVLL AVMAPRAGKT 
TALAIPMTLA APGPVLATGN KADLWAATAQ VRAGDGRRVW TFDPQAIAHA PQTWWWNPLA 
AVHAVEDADR LAGHFLQEIR GEKTGGDFWQ AAAGDLLAAL FLAAATSGRT LLDVYEWLND 
SASPVPAELL AAGGYPAVAA GLRGRQAGAP ETREGVYETA RAAARCLRND RILAWVTPGH 
TDRRLDVAAI PAGRDVLHLL SKTDEGAASP LVAALTDQIV RAAVVAAERS GGRLDPPLAL 
VLDEAANICK IADLPDLYSH LGSRGIVPLT ILQSYRQGVR VWGEAGMDAL WSAATIKIIG 
AGIDDPRLAE DLSRLVGDHD VDTTSVTRSA QGASSTISSR RQRILEAADI RAIPKGRALL 
LATGSRIAAI ALRPWYTGPR ATEITAAIRT AEATLTARAT GAHPAGEEET DDSPLTHL