Gene Francci3_0391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0391
Symbol
ID	3903633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	461909
End bp	463195
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	74%
IMG OID	637877720
Product	transposase, IS4
Protein accession	YP_479507
Protein GI	86739107
COG category	[L] Replication, recombination and repair
COG ID	[COG5659] FOG: Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTATCGC GGTGCGTGGC GGAGGGGTGG AAGGCCAGCG CGAGGGGCTG GTGGCGGGAG 
CATCAGCGTT TCCTGTACCA ACCCGAAAGT TGGACGCCGA TGCTCCCGGA CGTGACGATA 
CCGGTTTCTC TGGCGGTGCT GCTGGAGGGT TTCCGGCCGT GTTTCACCGC GCCGTCGTTC 
CGGACGTTCC GGGCGCTCGT CGTGGGGATG CTCGCCACCG GCGGGCGGCG CACGGTGTGC 
GGGATGCTCG TCGGCGCGGG CCTGTCCACG CTGTGGCCGC ACGACCGGGC GCACCGGTTT 
TTCGCGCGGG CGGTCTGGTC GCCGGAGAAG GTCGGCCTGG CGCTCGCCCG GCTCGTCGTC 
GACCGCCTCG TCCCGGCCGG GCCGCTGCAC GTCGTCGTCG ATGACACCCT GTTCCACCGG 
GCGGGGAAGA AGGTGTGGGC GGTGGGCTGG TTCCACGACG GATCCGCGAA GGGGCCAGAC 
CAGGTCGGGT TCGGCAACAA CTGGGTGATC GTCGGCCTCG TCGTGCCGGC GCCGCTGCTC 
GGCCGGCCGG TCTGCCTGCC GGTCCTGGCC CGCCTGGTCC GCAAGGACAC CGTCTCGGCC 
TCGCGGCTCT GGCTGGCCGC CCGCGCGGTC GAACAGCTGG CCGGGGCGTT CCCCGCCCGC 
CGGGTCCACG TCGTCGCGGA TGCCGCCTAC GCCGGCGACG AGCTCAGGGG ACTGCCGGCC 
TCGGTGACCT GGACGACCCG GCTCCGCCGC GACGCCGCCC TGTTCGCCCC CGCCCCACCC 
CGCACCGGGA GACGTGGCCG GCCCCGACTC AAGGGCGACC GGTTGCCCTC CCTCGCCCAG 
CTCGCCGCGG CCGCGACGTT CCGCCCGACG GCCGTGACCC GCTACGGCCG CGCCGGGACC 
GTGCACACGG CGGTCATCCG CTGCCTGTGG TACGGAGTGT TCGGCCCCCG CCCCGTCACC 
GTCGTCCTCG TCCGCGACAC CGACCGGCCC GGGACCTACG ACCTCGCGCT CGTCACGACC 
GACACCCTGA CCAGGCCCGC CGAGCTCGTC GCCCGCTATG CGGCCCGCTG GTCGATCGAG 
GTCGCGATCG CGGACGCGAA GCAGATCTTC GGGGTCGGCC AGGCCCGCAA CCGACTCACC 
GCCGCCGTCG AACGCACCGT CCCGTTCGGC CTGACCTGCC AGACCCTCGC CTTCGCCTGG 
TACCTCACCA CCGGCCACCA CCACGGCGAC GCCGCCGACC ACCGCGCCCG CACCCCCTGG 
CAGGGCCCCG GCAAAGTTGT CGGTTAG

Protein sequence

MVSRCVAEGW KASARGWWRE HQRFLYQPES WTPMLPDVTI PVSLAVLLEG FRPCFTAPSF 
RTFRALVVGM LATGGRRTVC GMLVGAGLST LWPHDRAHRF FARAVWSPEK VGLALARLVV 
DRLVPAGPLH VVVDDTLFHR AGKKVWAVGW FHDGSAKGPD QVGFGNNWVI VGLVVPAPLL 
GRPVCLPVLA RLVRKDTVSA SRLWLAARAV EQLAGAFPAR RVHVVADAAY AGDELRGLPA 
SVTWTTRLRR DAALFAPAPP RTGRRGRPRL KGDRLPSLAQ LAAAATFRPT AVTRYGRAGT 
VHTAVIRCLW YGVFGPRPVT VVLVRDTDRP GTYDLALVTT DTLTRPAELV ARYAARWSIE 
VAIADAKQIF GVGQARNRLT AAVERTVPFG LTCQTLAFAW YLTTGHHHGD AADHRARTPW 
QGPGKVVG