Gene Francci3_1693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1693
Symbol
ID	3903270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2030717
End bp	2032606
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	72%
IMG OID	637879031
Product	Type IV secretory pathway VirB4 components-like
Protein accession	YP_480798
Protein GI	86740398
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3451] Type IV secretory pathway, VirB4 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000521447
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.17897
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGAC GAGCCCGACG CCGGACCTCC GCGCAGGCCC CCAGCCCGTC GACCCGGACA 
GTGGACGCTG CCGCGGCGGC GTTCGTCCCG GACGCACTCA CGATCGCGCC CCGCCACCTG 
GACGTCGGCG GGGATTACGT GGCCACGATG GCGATCACCG GCTATCCGCG TGAGGTCCAT 
GCCGGCTGGC TCGCCCCGCT GGTGACCTAC CCGGGCCGGG TCGACGTCGC CGTGCACGTC 
GAGCCGATTG ACCCGGTCAC CGCGGCGAAC CGGCTGCGCC GGCAGCTGTC GAAGCTGGAG 
TCCGGCCGGC AGCTCGGCGA CGAGAAGGGC CGGCTGGTCG ACCCGCAGGT CGAGGCGGCG 
ACCGAGGACG CCTACGACCT GTCCGCCCGC GTAGCCCGCG GCGAAGGCAA GCTGTTCAGG 
CTGGGTCTGT ATTTCACCGT CCATGCGGCC AGCGAAGCCG AGTTGGCCGA CGAGGTCGCC 
GCCGTGCGGG CGCTGGCGGC CAGCCTGCTG CTGGACGCCA AGCCAGTCAG CTACCGCTCG 
CTCCAGGGCT GGGTCAGCAC CCTGCCCCTC GGCTTGGACC AGGTGCGGAT GCGCCGCACC 
TTCGACACCG CAGCCCTGTC CGCGGCGTTC CCGTTCACGT CGCCCGATCT GCCGCCCGCC 
GACCCGACCT CTCTGGCTCC GACCGGGGTG CTCTACGGGC TCAACGTCGC GAGCAACGGG 
CTGGTCCACT GGGACCGGTT CGGCGACGTC GACAACCACA ACGCCGTCAT CCTCGGCCGC 
AGCGGCGCCG GCAAGTCCTA CCTGGTCAAG CTCGAACTCC TGCGCAGTCT CTACCGGGGC 
ATCGAGGTCC ACGTCGTCGA CCCGGAAGAC GAATACGCCC GGCTCGCCGC CGCGGTCGGC 
GCCAGCTACC TGCACCTCGG CGCCGACGAG GTGCGGATCA ACCCGTTCGA CCTGCCGATC 
CAGACCACCC CCGACGGGCG GCGCACCGCA CCGCGCGACG CGCTGGTGCG GCGCAGCCTG 
TTCCTGCACA CCGTTATCGC CGTCCTGGTC GGCCAGCTGA GTGCGGCCGA ACGGGCAGCC 
CTCGACGTCG CGATCACCGC CACCTACCAG GCCGCCGGGA TCAGCTCCGA CCCGCGCAGC 
TGGAACCGGC CGGCACCGCT GCTGGCCGAC CTCGCCACCA CCCTGGCCAG CTCCAACGAC 
CCGGCCGCGG TCGCGCTCGG CGCCCGGCTG CACCCGTTCA CCGCCGGGGC GTTCTCCGGC 
CTGTTCAACG GGCCGACGAC CCGCCGCGGC GACGGCCACC TTGTCGTCTA CTCGCTGCGC 
GACCTTGCGG ACGAGTTGAA GCCGATCGGG ACGCTACTCG TCCTCGACGC CGTGTGGCGG 
CGAGTCTCCA ACCCCGCCGA CCGCCGTCCC CGCTTGGTCG TAGTCGACGA GGCATGGCTG 
CTCATGCGCC AGCCCGCTGG CGCGGACTTC CTGTTCCGCA TGGCCAAGTC GTCCCGCAAG 
CACTGGGCCG GGCTCACCGT GGCCACCCAG GACACCGCCG ACGTGCTCGC CACCGACCTC 
GGCAAAGCGA TCGTCACCAA CGCCGCCACC CAGATCCTGC TCCGCCAGGC ACCGCAGGCC 
ATCGACGAGA TCACCGCCAT CTTCGACCTG TCCCAGGGCG AACGGCAGTT CCTGCTGTCC 
GCCGACCGCG GACAAGGACT CCTCGCGGCG GGGGCACAAC GAGTCGCTTT CCAAGCCCTG 
GCCTCGCAGG TCGAGCACCG CCTGGTCACG ACCAACCCAG CCGAACTCGC CGCCGACCCC 
GACAACGCGG CCGACGACGG CTTCCTCGAT CTCGCCGTGC CGGACGACCC GACCGATGAC 
AACGGCCAGA TCTACCTCGA TGCCGCCTGA

Protein sequence

MSRRARRRTS AQAPSPSTRT VDAAAAAFVP DALTIAPRHL DVGGDYVATM AITGYPREVH 
AGWLAPLVTY PGRVDVAVHV EPIDPVTAAN RLRRQLSKLE SGRQLGDEKG RLVDPQVEAA 
TEDAYDLSAR VARGEGKLFR LGLYFTVHAA SEAELADEVA AVRALAASLL LDAKPVSYRS 
LQGWVSTLPL GLDQVRMRRT FDTAALSAAF PFTSPDLPPA DPTSLAPTGV LYGLNVASNG 
LVHWDRFGDV DNHNAVILGR SGAGKSYLVK LELLRSLYRG IEVHVVDPED EYARLAAAVG 
ASYLHLGADE VRINPFDLPI QTTPDGRRTA PRDALVRRSL FLHTVIAVLV GQLSAAERAA 
LDVAITATYQ AAGISSDPRS WNRPAPLLAD LATTLASSND PAAVALGARL HPFTAGAFSG 
LFNGPTTRRG DGHLVVYSLR DLADELKPIG TLLVLDAVWR RVSNPADRRP RLVVVDEAWL 
LMRQPAGADF LFRMAKSSRK HWAGLTVATQ DTADVLATDL GKAIVTNAAT QILLRQAPQA 
IDEITAIFDL SQGERQFLLS ADRGQGLLAA GAQRVAFQAL ASQVEHRLVT TNPAELAADP 
DNAADDGFLD LAVPDDPTDD NGQIYLDAA