Gene Francci3_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1016
Symbol
ID	3906258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1210973
End bp	1212196
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	73%
IMG OID	637878349
Product	transposase IS116/IS110/IS902
Protein accession	YP_480128
Protein GI	86739728
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTTCG TCGGTGACGA CTGGGCGCAG GACCACCACG ATGTGGAGGT GCAGGACGAG 
ACGGGTCGGC GACTGGCGAA GGGCCGGCTG CCGGAGGGCG TGGCCGGGAT CGCCCGGCTG 
CACGCGCTGA TCGGGCGGCA CCTGGCCGAG GACGCCGGCC CGGAGCAGGT CGTGGTCGGG 
ATCGAGACCG ACCGCGGCCC GTGGGTGCGG GCGCTCGTCG CGGCGGGCTA CCAGGTGATC 
GCGGTGAACC CGTTGCAGGC GGCGCGGTAC CGGGAGCGGT ACTCGACGTC GGGTGCCAAG 
AGCGACGCCG GCGACGCGCA CAGCCTGGCG GACATGGTCC GTACGGACCG TCACCAGCTG 
CGGCCGGTCG CTGGGGACAG TGACACCGCC GAGGCGGTGA AGATCGTGGC GCGGGCGCAT 
CAGAACCTGA TCTGGGACCG GACCCGCCAG ACCCAGCGGC TGCGCTCGGC GCTCCTGGAG 
TTCTTCCCGG CCGCGCTGGC CGCGTTCGAC GACCTCGATA CCCCTGACGC GCTGGAGCTT 
CTCGCGAAGG CGCCGTCGCC GGCCGAGGCC GCGAGGCTGA CCGTTGCGCA GATCAGCGCC 
GCGCTCAGGC ACGCCCGCCG GCGGAAGATC CCCGAGAGGG CGGCCGCGAT CCGGGCGGCG 
CTGCGGGCCG AGCAGCTGCC CGTCACGCCG GCGGCGACCA CCGCCTACGC CGCGGTCGTG 
CGCGCCCAGG CCGGGCTGCT CGCAGCCCTC AACGGCGAGA TCGCCCGGCT CGAGGAGCAG 
GTCGCGGACC ATTTTGACCA GCACCCGGAC GCGAAGATCC TGCTGTCCCA GCCCGGCCTG 
GGACCGGTCC TCGCGGCCCG GGTGCTCGCC GAGTTCGGTG ACGACCCGAC GCGCTACGCC 
GACGCGAAGG CACGGAAGAA CTACGCCGGC ACGAGCCCGA TCACCCGCGC CTCCGGGAAG 
AAGAAGACGG TCCTGGCCCG CTACGCACGC AACAACCGGC TCGCCGACGC GCTACATCAG 
CAGGCGCTCT CGGCCCTGAG CGCATCCCCG GGCGCCCGGT CGTACTACGA CGCGATCCGC 
GCGCGCGGCA CGTCGCACCA CGCCGCGCTG CGCCAGCTCG GCAACCGGCT CGTCGGAATC 
CTGCACGGCT GCCTCAAGAC CCACACCCCC TACAGTGAGG CAACCGCATG GACACAGAAA 
GCAACACTCG ACGTCGCCGC TTGA

Protein sequence

MLFVGDDWAQ DHHDVEVQDE TGRRLAKGRL PEGVAGIARL HALIGRHLAE DAGPEQVVVG 
IETDRGPWVR ALVAAGYQVI AVNPLQAARY RERYSTSGAK SDAGDAHSLA DMVRTDRHQL 
RPVAGDSDTA EAVKIVARAH QNLIWDRTRQ TQRLRSALLE FFPAALAAFD DLDTPDALEL 
LAKAPSPAEA ARLTVAQISA ALRHARRRKI PERAAAIRAA LRAEQLPVTP AATTAYAAVV 
RAQAGLLAAL NGEIARLEEQ VADHFDQHPD AKILLSQPGL GPVLAARVLA EFGDDPTRYA 
DAKARKNYAG TSPITRASGK KKTVLARYAR NNRLADALHQ QALSALSASP GARSYYDAIR 
ARGTSHHAAL RQLGNRLVGI LHGCLKTHTP YSEATAWTQK ATLDVAA