Gene Francci3_3332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3332
Symbol
ID	3904118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3949543
End bp	3950892
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	72%
IMG OID	637880657
Product	type II secretion system protein E
Protein accession	YP_482418
Protein GI	86742018
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0077596
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGC AGTCGAGCAC CTCCGGGTCC GACGGCGGGT CCGATGTCGC CGAGGATGTA 
GCGAGCACGA TCAACACGGC GGTGCAGCGT CAGGTGGCGG CGGCGCGCCG CAGCGGCCGG 
CGGTTCACCC CCACGGAACG CGCCGCGCTC GCCGAGGAGC TCCTCGCCCG GGAACTGGCC 
GACATCCGGC GCGGCGCGGC CGACGCGCCG CCGCTGGACG CGGCCGGGGA GAACGAGGTG 
CGGCTGCTGG TCCGCCAGGC CCAGTCGCAG CTGGGTTCGC TCGGCCCGTT CCTGCTGGCG 
GACCGGTTTT CCGATGTGGA GGTCAACGGC GCGGTCAACC TGGTGCTGAC CGAGCGCGGC 
AGCGGGCATC GGATCGAGGG ACGGTCTCCG TTCGGTAGCG ACGCCCAGGC GTTTGAGTGG 
GTGGCCGAGC ATGCGGCGTC GGTCGGCCGC CGGTTCGACG AGAGCAACCC GTCGGTGCGG 
TTCCGGCTGC CGAACGGGGT TCGGGTGCAC GCGGTGTCCC GGGTGACTCG CCTGACCCAT 
ATCGACTGCC GGTTGTTCCG GCCCGGCCTG GACACCCTGG ACGGGCTCGC CGACGCGGGG 
ATGTTCGGAT CTGACATCAC CGCCCTGCTC GCGGGGACGG CGGCTTTGCG TCAACCGTTT 
GGGCTGATCA TCTCGGGTGG GACGGGAGCG GGGAAGACGA CGCTGCTGCG GGCGTGGGTC 
AACGCCACAC CCGACGATCC GATCCTCGAC CGGATGGTGA CGGTGGAGGA TGAGCAGGAG 
CTGTTCCTGG CCCCGGAGCG GTTCCGCAAC CTGGTGGAGT TCGAGGCCCG CGAGCGCAAC 
GTCGACGGCC GCGGCGAGTA TTCGATGGCG CGGTATCTCG CGGAGAACCT GCGCCGTCAG 
ACCCCGCACC GGGTCCTGCT CGGGGAACTG CGCCCCGACG GCGGCGTCCT GCCGCTGCTG 
CTGGCGCTCG GGCAGGGCAT CGCCCAAGGG GTGGCGACGA CGATCCACGC ACCGAGCGCC 
GCCGACGTCG TCGCCCGGCT ACGCACGTAT GCGGCGTTCG ACCCGGGGCG GGTGCCGGAG 
GCGGCGGTGT TGGAGACCAT CGCGTCCACC GTCGATCTGA TCGTGCATGT CGCGAACCTG 
GACGGCCGGC GGGTGGTCAC GAGCGTGCAT GAGGTCGGGG AGTACCGGGA GGGCCGGGTG 
ACCTCGGCGG AGCTGTGGCG CTGGGACGCG AGGATCGAGC GGGCGGTACG CACGGACCTG 
GACTTCTCCG ACCAGCTCGC CGCCAAGCTG CGTTCCGCCG GGGTCGGCCC GGCGGTCCTC 
ACCCGGCGCC GGACGAGGGC GGCCTGGTGA

Protein sequence

MSLQSSTSGS DGGSDVAEDV ASTINTAVQR QVAAARRSGR RFTPTERAAL AEELLARELA 
DIRRGAADAP PLDAAGENEV RLLVRQAQSQ LGSLGPFLLA DRFSDVEVNG AVNLVLTERG 
SGHRIEGRSP FGSDAQAFEW VAEHAASVGR RFDESNPSVR FRLPNGVRVH AVSRVTRLTH 
IDCRLFRPGL DTLDGLADAG MFGSDITALL AGTAALRQPF GLIISGGTGA GKTTLLRAWV 
NATPDDPILD RMVTVEDEQE LFLAPERFRN LVEFEARERN VDGRGEYSMA RYLAENLRRQ 
TPHRVLLGEL RPDGGVLPLL LALGQGIAQG VATTIHAPSA ADVVARLRTY AAFDPGRVPE 
AAVLETIAST VDLIVHVANL DGRRVVTSVH EVGEYREGRV TSAELWRWDA RIERAVRTDL 
DFSDQLAAKL RSAGVGPAVL TRRRTRAAW