Gene Francci3_2183 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2183
Symbol
ID	3906783
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2556883
End bp	2558121
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	72%
IMG OID	637879516
Product	transposase, IS4
Protein accession	YP_481282
Protein GI	86740882
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.208464
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGGCATG ACGGGAGTGA GGGGCTGTCG CCGGAGGGCT GGTTGCCGGA CCGGGTGACG 
GTGGGTGTGT TGACGCGGGT GTACCCACCG GAGCTGGTGG ACCGGGTGTT GGCGGTGACC 
GACACCGCGG AGGTTCGCCG CCGGCTGTTG CCGTCGTGGC TGGTGGTGTA CTTCGTGTTG 
GCGTTGTGGC TGTTCCGGGG CCGGAACTGT GGCTATGTGC AGGTGCTGGC CCGGTTGACC 
AGCGGGCTGC ACTTCCAGCG CCGGGCGGCT GTGTTGGCCG CGGGTGGGGC GGGTGGGGCG 
GGTTGGTCGC TGCCGGCAAG CCCGTCGCTG GGCGAGGCGC GGGCACGGAT CGGGTCGGAT 
CCGGTGCGGA TGCTGTTCGA GCACGCCGCG GGGCCGGTCG GTGTCGAGGG CCAGGCCGGG 
GTGTTCCTGC ACGGCCTGCG GCTGGTGCAG ATCGACGGGT CGACCTGCGA TCTGCCGGAC 
ACGCAGGCCA ACCGGGCGTT CTTCCCCGGG CCGTCGAACG CCGGTGGGCC GGCGCCGTTC 
CCGAAGGTTC GCTGGGTCAT CGCCGCCGAG GCCGCCACCG GTGCCCTGCT GGGGGCGTCG 
TTCGGCCCGT GGAGCACCGG CGAGCCGGCG CTGGCCCGTG ACCTGCTGGG GCAGCTGGGC 
CCGGGCATGC TCACGTTGGC GGACCGTAAC TTCCTGTCCC ACCGGCTCGC CGGCGAGGTC 
CTGGCGACCG GGGCGCACCT GCTGTGGCGG GCGAAGGCGA CCTTCACGCT GGCCCCGGTC 
CACGTCCTCG ACGATGGCAG CTACCTCGCC GAGCTGACAC CTCCCCGCGG AAGCGAGGGA 
CCACCACTGA CGATGCGGGT GATCGAGTAC ACCGTGCACT CCACCACCGC CGGCGGCGAC 
GAGAGCAGCT CAGAGCTGTT CTGTCTGGTC ACCGACCTGC TCGACCCCGA GGAATGGTCC 
ATGCTCGACC TGGCCCGCGC CTACCCGACC AGGTGGGGAT GCGAGACCGT GATCGGCCAC 
CACAAGACCG ATCTCGGTGA AGGCCGACCC GTCCTGCGCA GCAAGGACCC CGAAGGCGTC 
GCCCAGGAGA TGTGGGCCCT GTTCGCCGTC CACCAGGCAC TCGCCCGCCT CATCGGTGTC 
GCTGCCGACA CCACCGGCAC CCCACCCGAC AGGATCAGTT TCCGTCGGGC CCTCACCGCC 
GCGTCCGATT CCATCGGGAC CGCGGCTTTC CCCCCCTGA

Protein sequence

MGHDGSEGLS PEGWLPDRVT VGVLTRVYPP ELVDRVLAVT DTAEVRRRLL PSWLVVYFVL 
ALWLFRGRNC GYVQVLARLT SGLHFQRRAA VLAAGGAGGA GWSLPASPSL GEARARIGSD 
PVRMLFEHAA GPVGVEGQAG VFLHGLRLVQ IDGSTCDLPD TQANRAFFPG PSNAGGPAPF 
PKVRWVIAAE AATGALLGAS FGPWSTGEPA LARDLLGQLG PGMLTLADRN FLSHRLAGEV 
LATGAHLLWR AKATFTLAPV HVLDDGSYLA ELTPPRGSEG PPLTMRVIEY TVHSTTAGGD 
ESSSELFCLV TDLLDPEEWS MLDLARAYPT RWGCETVIGH HKTDLGEGRP VLRSKDPEGV 
AQEMWALFAV HQALARLIGV AADTTGTPPD RISFRRALTA ASDSIGTAAF PP