Gene Francci3_2124 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2124
Symbol
ID	3905514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2494191
End bp	2495429
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	68%
IMG OID	637879459
Product	transposase IS116/IS110/IS902
Protein accession	YP_481225
Protein GI	86740825
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.29674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGTGG TGATCGACCG GGTCGCCGGG TTGGACGTGC GCCGGGACAC GGTCGTGGCG 
GCGGTCCGGG TTGGCGGGCG TGGTGGCGGC AGGCGGGGGG AGGTGCGGAC CTTCGCCACG 
ACGGGAGCGG GACTGACCCG GCTGGCCGGG TGGCTGTCGG AACAGCGGGT TTCTCTGGTG 
GGTATGGAAT CCACCGGCGT CTACTGGAAG CCGGTGTTCC ACCTGCTGGA AGACCGGTTC 
GAGTGCTGGC TCCTCAACGC CACCCACGTC CGCAACGTAC CAGGCCGAAA AACAGACGTC 
GCGGACGCGG CGTGGATCTC GGACCTCGTC GCGCACGGCC TGGTACGCGC CTCGTTCGTG 
CCGCCGAAAC CCCAGCGGGA CCTGCGTGAC CTGACCCGGG CCCGGCGGAT CGTGGTCGAG 
GAGAAGACCC GGGAGATCCA GCGGCTGGAG AAACTGATGC AGGACGCCGG CGTGAAACTC 
ACCAGCGTCG CCTCCAAGCT ACTCGGGGTC TCGGGCCGTG CGATCCTGGA GAAGATGATC 
GAGGGAGAGC AGTCCCTGGA ATATCTCGCT GATCAGGCCC GTGGCCGACT CCGCAGCAAG 
ATCCCACAGT TGCAGGAGGC ACTCGCGGGA ACGTTCCGCT CCGGGCATCA CGGGTTCCTC 
GCCGCGCAGC TCCTGGCCCG GATCGACCTG TGTGACGAGC AGATCGACGA GCTCGACCAC 
CGGATCGAGG TGATGATCGC CCCTTTTCGG GAGACGGTCG ACCGGATCCG CACGATCACC 
GGGGTCGGTG AGGTCACCGC GACCGTGCTG CTCGCCGAGG TCGGCCTGGA CATGAGCCGG 
TTCCCCACCG CCGGCCATCT CGCGTCCTGG GCGGGTATCT GTCCGGGGAA CAACACCTCG 
GGAGGGAAAC GCCTGTCCGG GCGGACCCGA CACGGTAACA AGTGGTTACG TACCGCGTTG 
ACCGAGGCCG CGCACGCCGC CGCCCGGAGC AAGGACACCT ACCTGGCGTC CCACCACGCC 
CAGGTCCGTG GCCGCCGCGG TGTCCTGAAA GCGATCGGCG CGACCCGCCA CGACATTCTC 
ATCGCCTACT GGCACATCAT CGCGAACAAG ACCGTCTACC AGGACCTCGG CGGAGACTGG 
CATGCCCGCC GACGCCGGGA CCCTGAACGC CGCCGGAAGA ACCTCGTCGG CGAACTGGAG 
AAACTCGGCT ACACCGTCAC CATCACACCA GCGGCATAG

Protein sequence

MDVVIDRVAG LDVRRDTVVA AVRVGGRGGG RRGEVRTFAT TGAGLTRLAG WLSEQRVSLV 
GMESTGVYWK PVFHLLEDRF ECWLLNATHV RNVPGRKTDV ADAAWISDLV AHGLVRASFV 
PPKPQRDLRD LTRARRIVVE EKTREIQRLE KLMQDAGVKL TSVASKLLGV SGRAILEKMI 
EGEQSLEYLA DQARGRLRSK IPQLQEALAG TFRSGHHGFL AAQLLARIDL CDEQIDELDH 
RIEVMIAPFR ETVDRIRTIT GVGEVTATVL LAEVGLDMSR FPTAGHLASW AGICPGNNTS 
GGKRLSGRTR HGNKWLRTAL TEAAHAAARS KDTYLASHHA QVRGRRGVLK AIGATRHDIL 
IAYWHIIANK TVYQDLGGDW HARRRRDPER RRKNLVGELE KLGYTVTITP AA