Gene Francci3_0300 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0300
Symbol
ID	3903332
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	348360
End bp	349589
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	71%
IMG OID	637877629
Product	transposase, IS4
Protein accession	YP_479416
Protein GI	86739016
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.563968
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCGGT CGCTGCGGGT CCTGGGGGCG CACGGCGGTG AGGTGCAGGG GCTCGCCGAC 
GTACTCGCCG GGGTGCCTGA CCCGCGGGAC CCGCGAGGGA TACGTCACCG GCTCCCGGTG 
ATCCTGGGAC TGTCCGCCGC AGCGGTCGCC GCGGGGGAGA AGTCGGTGGA GGAGATCGCG 
GCCTGGGCTG CGCACGCCCC GACGCAGGTC CTGACCGCTC TCGGGGCGCG GGTCCATCCG 
GTGACCGGGC AGCCGCAGGC ACCGTCGGTG GACACGATGA TCCGGGTCCT GTCCGCGGTG 
GACAGCTCGG CGCTGGCGAG GGCGGTCGGG ATGTTCGCCG CGGCCCGCGC CCGCCAGGCC 
CGTGGTGGTG GGCGGCGGGT GGTCGCGGTC GACGGGAAGA CCCTGCGTGG CGCGGCTGGG 
CCTGAGGGGC GGGCACCGCA CCTGCTCGCG GTCGCCGAAC ACGGCACGGG TGTGGTGCTC 
GCCGAGCATG AGGTCGGCGC GAAGACGAAC GAGGTCACCG CGTTCGCACC GCTGCTCCGC 
GAACTGCATT CCCATGATCC GCTGGATGGG GTGGTGGTGA CCGCTGATGC GTTGCACACG 
ACCCGCGCCC ACGCCGACCT GATCGTCACC GAGCTGGGAG CGCACTTCGT GTTCACGGTG 
AAGGCGAACA CCCCGGCGTT GTCGGTCGAC TGCCACCAGG CGACCGACTG GACGAAGATC 
CCGATCGGGC ACAGCGCCGA GGGCAGGGCC CATGGACGGT TCGAACGACG CACCATCCAG 
CTGGCCCAGG CCAGCGAGGC GATCCGTGCC CGCTATCCCC ATGCCCGCAC CGTGGCGCGG 
ATCCGCCGTC ATGTCCGGCG GACCGTGACC ACCGGCACGG GCCGGGCCCG GGTCACCCGG 
ACGATCCCGA GCACTGTCAC GGTCCACGTC CTGACGAGCC TCACCCTCGA CGCGGTCACA 
CCCGCTGATC TCGCGGGCTA CGCCCGAGGG CATTGGACGA TCGAGAACAA GGTCCACTGG 
GTGCGCGATG TGACGTTCCG TGAGGATGCC TCGCGGGTTC GGACCGGCCC ACTGCCCCGC 
ATCATGACCA CACTCCGTAA CCTGATCATC GGGCTGATTC GCCTCGCTGG CCATAACCGC 
ATCGCCCCGA CCATCCGCAG AATCCGACAC GACAACGCCC TGCTCCTGGC CATCCTCACT 
CTCGACAACC CCGCTGACCT GCATCAATGA

Protein sequence

MRRSLRVLGA HGGEVQGLAD VLAGVPDPRD PRGIRHRLPV ILGLSAAAVA AGEKSVEEIA 
AWAAHAPTQV LTALGARVHP VTGQPQAPSV DTMIRVLSAV DSSALARAVG MFAAARARQA 
RGGGRRVVAV DGKTLRGAAG PEGRAPHLLA VAEHGTGVVL AEHEVGAKTN EVTAFAPLLR 
ELHSHDPLDG VVVTADALHT TRAHADLIVT ELGAHFVFTV KANTPALSVD CHQATDWTKI 
PIGHSAEGRA HGRFERRTIQ LAQASEAIRA RYPHARTVAR IRRHVRRTVT TGTGRARVTR 
TIPSTVTVHV LTSLTLDAVT PADLAGYARG HWTIENKVHW VRDVTFREDA SRVRTGPLPR 
IMTTLRNLII GLIRLAGHNR IAPTIRRIRH DNALLLAILT LDNPADLHQ