Gene Francci3_1872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1872
Symbol
ID	3906147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2207079
End bp	2208209
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	69%
IMG OID	637879210
Product	IS630 family transposase
Protein accession	YP_480977
Protein GI	86740577
COG category	[L] Replication, recombination and repair
COG ID	[COG3415] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.226445
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGACG CGGCCCGCGG CTACTCCAAC GCGCGGATAG CCCGGCGACT GTGCGTGACC 
GAGGACACGG TCCGCACGTG GCGGGGCCGG TTCGCGCGGC GACGCGAGGC GGGACTGGTC 
GACCTGCCCC GGTCGGGTCG GCCACGGCGG ATCAGCGAGG CGGAACGGGC CGAGGTCGTC 
GCGCTGGCCT GCCAGTTACC TGCCGAGACC CAGGTGCCGC TGGCCCGCTG GTCGTGTCCG 
GAACTCGCCG CCGAACTGCT CTCCCGCGGC CTGGTCGACG CGATCTCGGC GTCGTCGGTG 
CGGCGGATCC TCGCCGAGCA CCCGATCAAA CCGTGGCGCT ACCAGTCCTG GATCTTCGCG 
CGCGGCCCGG GCTTCGCCGC GAAGGCGAAA GTGATCCTCG ATCTCTACGA GGGCTTCTAC 
CAGGAGGAAC CCCTCGGCCC CGAGGATCGA ATCGTCTCGA TCGACGCGAA GCCGTCGATC 
CAGGCGAGAG CCCGGATCCA CCCGACCACC CCGCCCGCCC CGGGCAGGAT CATCCGGGTC 
GAGCACGAGT ACGAACGTCA CGGCGCGCTC GCGCTGTTGC CCGCGCTCGA CGTCCAGACC 
GGGAGGATCG CCGCCGTGCT GACCCCGCCG ACGACGGGCA TCGCGCCGTT CATGGAACTG 
ATGGGCCAGG TCATGGCCCA GGACCGCTAC CGGACGGCGA AGCGCGTGTT CGTGATCGTC 
GACAACGGCT CCGACCACCG AGGCCAGGCC TCGATCAACC GACTCAGGGC CGCCCACCCG 
AACCGCATCC TGATCCACAC CCCGACACAC GCCTCATGGC TGAACCAAGT GGAGATCTTC 
TTCTCGCTCG TCCAACGGAA GGTCGTGTCA CCCTGCGACT TCGCCAGCCT CGACGTGCTC 
GCCGACACCC TGACAGCGTT CGTCGACCGC TACAACGTCA CCGCCACACC GTTCAAGTGG 
AAGTACACCG CGGCCGACCT CGAACGCCAC CTCGCCCGCC TCGACGACGA CACAGCACCA 
GCCGTCGCGG GCTCCGTCGC TCGGTTGCCC GTCCCACCAC CCGACACCAA TGATCACGGG 
AGTCGGGTGG AGTCCGAACC AAGTGCCAGA GCCCTCGCGC AGGCCGCCTA A

Protein sequence

MLDAARGYSN ARIARRLCVT EDTVRTWRGR FARRREAGLV DLPRSGRPRR ISEAERAEVV 
ALACQLPAET QVPLARWSCP ELAAELLSRG LVDAISASSV RRILAEHPIK PWRYQSWIFA 
RGPGFAAKAK VILDLYEGFY QEEPLGPEDR IVSIDAKPSI QARARIHPTT PPAPGRIIRV 
EHEYERHGAL ALLPALDVQT GRIAAVLTPP TTGIAPFMEL MGQVMAQDRY RTAKRVFVIV 
DNGSDHRGQA SINRLRAAHP NRILIHTPTH ASWLNQVEIF FSLVQRKVVS PCDFASLDVL 
ADTLTAFVDR YNVTATPFKW KYTAADLERH LARLDDDTAP AVAGSVARLP VPPPDTNDHG 
SRVESEPSAR ALAQAA