Gene Francci3_4013 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4013
Symbol
ID	3906974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4798193
End bp	4799617
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	74%
IMG OID	637881342
Product	transposase, IS4
Protein accession	YP_483092
Protein GI	86742692
COG category	[L] Replication, recombination and repair
COG ID	[COG5659] FOG: Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTATCGC GGTGCGTGGC GGAGGGGTGG AAGGCCAGCG CGAGGGGCTG GTGGCGGGAG 
CATCAGCGTT TCCTGTACCA ACCCGAAAGT TGGACGCCGA TGCTCCCGGA CGTGACGATA 
CCGGTTTCTC TGGCGGTGCT GCTGGAGGGT TTCCGGCCGT GTTTCACCGC GCCGTCGTTC 
CGGACGTTCC GGGCGCTCGT CGTGGGGATG CTCGCCACCG GCGGGCGGCG CACGGTGTGC 
GGGATGCTCG TCGGCGCGGG CCTGTCCACG CTGTGGCCGC ACGACCGGGC GCACCGGTTT 
TTCGCGCGGG CGGTCTGGTC GCCGGAGAAG GTCGGCCTGG CGCTCGCCCG GCTCGTCGTC 
GACCGCCTCG TCCCGGCCGG GCCGCTGCAC GTCGTCGTCG ATGACACCCT GTTCCACCGG 
GCGGGGAAGA AGGTGTGGGC GGTGGGCTGG TTCCACGACG GATCCGCGAA GGGGCCAGAC 
CAGGTCGGGT TCGGCAACAA CTGGGTGATC GTCGGCCTCG TCGTGCCGGC GCCGCTGCTC 
GGCCGGCCGG TCTGCCTGCC GGTCCTGGCC CGCCTGGTCC GCAAGGACAC CGTCTCGGCC 
TCGCGGCTCT GGCTGGCCGC CCGCGCGGTC GAACAGCTGG CCGGGGCGTT CCCCGCCCGC 
CGGGTCCACG TCGTCGCGGA TGCCGCCTAC GCCGGCGACG AGCTCAGGGG ACTGCCGGCC 
TCGGTGACCT GGACGACCCG GCTCCGCCGC GACGCCGCCC TGTTCGCCCC CGCCCCACCC 
CGCACCGGGA GACGTGGCCG GCCCCGACTC AAGGGCGACC GGTTGCCCTC CCTCGCCCAG 
CTCGCCGCGG CCGCGACGTT CCGCCCGACG GCCGTGACCC GCTACGGCCG CGCCGGGACC 
GTGCACACGG CGGTCATCCG CTGCCTGTGG TACGGAGTGT TCGGCCCCCG CCCCGTCACC 
GTCGTCCTCG TCCGCGACAC CGACCGGCCC GGGACCTACG ACCTCGCGCT CGTCACGACC 
GACACCCTGA CCAGGCCCGC CGAGCTCGTC GCCCGCTATG CGGCCCGCTG GTCGATCGAG 
GTCGCGATCG CGGACGCGAA GCAGATCTTC GGGGTCGGCC AGGCCCGCAA CCGACTCACC 
GCCGCCGTCG AACGCACCGT CCCGTTCGGC CTGGCCTGCC AGACCCTCGC CTTCGCCTGG 
TACCTCACCA CCGGCCACCA CCACGGCGAC GCCGCCGACC ACCGCGCCCG CACCCCCTGG 
TACACCACCA AGACCCGCCC CTGCACCGCC GACCTCGCCG TCAAGCTCCG CCGCGTCCTG 
ATCACCACCC AATATCAGCC CACACGGCCC GCGAACCCGA CCGACGCGGA AATCCACACC 
CTCCGCCTCG CCTGGGCCAC CACCGACAGC GCCCTCGCGG CCTGA

Protein sequence

MVSRCVAEGW KASARGWWRE HQRFLYQPES WTPMLPDVTI PVSLAVLLEG FRPCFTAPSF 
RTFRALVVGM LATGGRRTVC GMLVGAGLST LWPHDRAHRF FARAVWSPEK VGLALARLVV 
DRLVPAGPLH VVVDDTLFHR AGKKVWAVGW FHDGSAKGPD QVGFGNNWVI VGLVVPAPLL 
GRPVCLPVLA RLVRKDTVSA SRLWLAARAV EQLAGAFPAR RVHVVADAAY AGDELRGLPA 
SVTWTTRLRR DAALFAPAPP RTGRRGRPRL KGDRLPSLAQ LAAAATFRPT AVTRYGRAGT 
VHTAVIRCLW YGVFGPRPVT VVLVRDTDRP GTYDLALVTT DTLTRPAELV ARYAARWSIE 
VAIADAKQIF GVGQARNRLT AAVERTVPFG LACQTLAFAW YLTTGHHHGD AADHRARTPW 
YTTKTRPCTA DLAVKLRRVL ITTQYQPTRP ANPTDAEIHT LRLAWATTDS ALAA