Gene Francci3_3430 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3430
Symbol
ID	3905670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4078669
End bp	4079997
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	72%
IMG OID	637880753
Product	transposase
Protein accession	YP_482513
Protein GI	86742113
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACGC TCCAGGCGTA CCGCTTCGCC CTCGACCCGA ACCAGGCCCA GCTCGCCGGT 
ATCCGCCGCC ACGCCGGGGC GTCGAGGTTC GCCTACAACT GGGGCCTGGC CCGGGTGAAG 
GCCGCGCACG CCCAGCGTGA CGCCGAGCAG TCCTACGGGC TGACGGGCGA CCTGCTCACC 
CCCGTCCCGT GGACGCTCCC CGCGCTGCGC CTCGCGTGGA ACGCGGTCAA GCGGGACATC 
GCCCCATGGT GGGACGAGTG CTCGAAGGAG GCGTTCCGCG CCGGGCTCGA CCAGCTTGCC 
CGCGGGTTGA AGAACTTCAC CGACTCCCGG CAAGGGAAGC GGAAGGGCCG GCGGGTCGGC 
TTTCCCAGGT TCAAGAAGCG GGGAAAGGCC CGTGACTCGT TCCGGTACAC CACCGGCGCC 
TACGGCCCGG CTGACGAGAC CTACGTGAAG CTGCCCCGGA TCGGGCGGGT GAAGGTCCAC 
GAGCCGATGG GCGCCCTGAC CGGCCGGCTG GCCGACGGAC GTGCCCGACT GTTCGGCGTG 
ACCGTGTCCC GGACTGCTGA CCGCTGGTTC GTGTCGTTCA CCGTCGAGGT CGACCGCGAC 
GTTCCCGAGC GGCCGTCGCG ACGGCAACGC GCGGGCGGCC CGGTGGGCGT CGACCTCGGC 
GTGAAGCACC TCGCTGTTCT GTCGACCGGG CAGACCGTTC CCAACCCGAA GCACTACCAG 
CGGGCCGAAC GGCGACTGCG CCGGGCGTCG CGGGCCCACG CCCGGTCGAA GCCGGGCAGC 
GCTGGGCGGC GGCAGCGCGC CGCCCAGCTC GCGACGATCC ATGTCCGGGT CGCGAACCAG 
CGCCACAACG GGCTGCACAA GCTCACGACC CGGCTCGCCC GGTCCCACGA CACGGTCGTC 
GTCGAAGATC TGCACGTCGC CGGGATGGTC CGTAACCGGC GGCTCGCCCG CGCGGTCGCC 
GACGCCGGCA TGGCCGAGGT CCGCCGGCAG CTTGCCTACA AGACCCGCTG GTACGGATCG 
ACGCTCGTCG TCGCCGACCG CTGGTATCCC AGCTCGAAGA CCTGCTCCGG CTGCGGCTGG 
CGAAACCCAA GCCTGACGCT GTCCGAGCGC ACCTTCACCT GCCAGTCCTG CGGGCTGGTA 
CTCGACCGCG ACCACAACGC CGCGATCAAC CTGCACCACC TCGTCGCCGC CAGTACACCG 
GAGACGGAAA ACGCCCGTGG AGCCGACCGT AAGACCCGCG CAAGCGGGCG GGTGGCTGGG 
AAGCGGGAAC CCGGCACGGC CACGGCCGGT CAGACCGGGG GTGCCTCGCC GAGAGGCGAG 
GCGGCATGA

Protein sequence

MTTLQAYRFA LDPNQAQLAG IRRHAGASRF AYNWGLARVK AAHAQRDAEQ SYGLTGDLLT 
PVPWTLPALR LAWNAVKRDI APWWDECSKE AFRAGLDQLA RGLKNFTDSR QGKRKGRRVG 
FPRFKKRGKA RDSFRYTTGA YGPADETYVK LPRIGRVKVH EPMGALTGRL ADGRARLFGV 
TVSRTADRWF VSFTVEVDRD VPERPSRRQR AGGPVGVDLG VKHLAVLSTG QTVPNPKHYQ 
RAERRLRRAS RAHARSKPGS AGRRQRAAQL ATIHVRVANQ RHNGLHKLTT RLARSHDTVV 
VEDLHVAGMV RNRRLARAVA DAGMAEVRRQ LAYKTRWYGS TLVVADRWYP SSKTCSGCGW 
RNPSLTLSER TFTCQSCGLV LDRDHNAAIN LHHLVAASTP ETENARGADR KTRASGRVAG 
KREPGTATAG QTGGASPRGE AA