Gene Francci3_3405 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3405
Symbol
ID	3905645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4038703
End bp	4040217
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	70%
IMG OID	637880728
Product	twin-arginine translocation pathway signal
Protein accession	YP_482488
Protein GI	86742088
COG category	[R] General function prediction only
COG ID	[COG3211] Predicted phosphatase
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.990674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGT TGACACGACG TAATCTGTTC CGGCACGGCA CGGCGGCGGG GGCCGTGGTG 
GTCCTGTCCG CCGAAGCGTT CAACCTGCTG GCGGCGAGCC CGGTGGGCGC GGCGACGGGA 
GGCTACGGGC CGCTGGTGGC CGACCCGGCC GGCAAGCTCG ATCTTCCCGC CGGCTTCCAT 
TACAAGGTGA TCGCGAAGGC CGGTACCTGG GGTCAGGCGC CCTACAACGA GCCGTTTGAC 
CGGCTCGACG ATCCGGGTAG CCCGCCGTAC CCGACCAAGT TCGACGGCAC CGGCTCGTTT 
CCTGGGACGC AGGGCGGGAC GATTCTGGTG CAGAACCACG AGCAGGACGC GGTGAACCCG 
GGCGCGCAGT TCACGCCGGT GGTGCCCAAG ACCACCGGGG CCGCGGTGTA CGACGGGTCG 
GCCACGAACG CGTTCGGTGG CACCACGAAC ATCGTGCTGG ACGTCAACGC GAACGTGCAG 
CGTCGCTACG TGAGCCTGGC CGGCACGATC CGCAACTGCG CCGGCGGGGT CACCCCCTGG 
GGTGCGTGGC TGACGTGCGA GGAAACAGAG TCGATCATCA GTGGTGGCAA GCGGCACGGC 
TATGTCTTCG AGGTCGACTC GCTGGGCCGC CGCACCACCG GGGCGCCGTT GACGGCGCTG 
GGCCGCTTCG CGCATGAGGC GGTCGCGGTC GATCCCAAGA CCAACTTCGC CTACCTCACC 
GAGGACGCGA GCGGCCCGAA CGGCCTGCTC TACCGGTTCC GCCCGACCCG GGCGACGGGC 
CAGTTCGGTG ACTACGCGGC GGGCGGCTGC CTGGAGGCGC TGCAGGCCTG GACCGCGGCC 
GGCAACCCGA TCGACGACCT TTCCCAGATC ACCAAGGTCG GCACCAGCCT GACAGTGAAG 
TGGGTGCCGG TGCTTGCTCC CGACCCGGAC GGGACCGACG CCTCGCCCTC GATCCGCAAG 
CAGTTCGCCT ACCCGGGCCG CCCCGCCACC CTGGCGGCGG CCAGCCCCGA CCGGGTGACC 
CGGTCGAAGA AGTTCGAGGG CGCCTTCTGG GCCCGGGACG CGGCCTGGAT CAACGCCAGC 
TATGCCAAGA AGGCCGACCT GCCCGCCTCC GTCAGCTACC CCGCGCTGCC CCCCACCGTC 
CACGATGGCC AGGTGTGGAA GTACCAGCCC GCCGCCGAAA CCCTGACTCT CGTCGCGCTG 
CTGCCGTCCC ACGAGGCCGC GGACGACTAC GACACGCCCG GAGTCTTCGA CGGGCCCGAC 
AACCTGTGCA TCACCCCGCA TGGTGGGGCG TTGTTGTGTG AGGACGGCGA CGGGCTCAAC 
TACGTCGTCG GTCTCGACCG CCAGGGCAGC CCCTTCGCCT TCGCCCAGAA CAAGATCCTG 
TTCCAGGATG GTGCCGACAA GATCTACCGG GAGTTCGTCG GCTCCTGCTT CTCCACCAAC 
GGCCGTTACC TGTTCGTCGC CACCCAGGAC CCGGGCATCG CCTACGCCGT CACCGGCCCC 
TGGCACACCG TCTGA

Protein sequence

MSELTRRNLF RHGTAAGAVV VLSAEAFNLL AASPVGAATG GYGPLVADPA GKLDLPAGFH 
YKVIAKAGTW GQAPYNEPFD RLDDPGSPPY PTKFDGTGSF PGTQGGTILV QNHEQDAVNP 
GAQFTPVVPK TTGAAVYDGS ATNAFGGTTN IVLDVNANVQ RRYVSLAGTI RNCAGGVTPW 
GAWLTCEETE SIISGGKRHG YVFEVDSLGR RTTGAPLTAL GRFAHEAVAV DPKTNFAYLT 
EDASGPNGLL YRFRPTRATG QFGDYAAGGC LEALQAWTAA GNPIDDLSQI TKVGTSLTVK 
WVPVLAPDPD GTDASPSIRK QFAYPGRPAT LAAASPDRVT RSKKFEGAFW ARDAAWINAS 
YAKKADLPAS VSYPALPPTV HDGQVWKYQP AAETLTLVAL LPSHEAADDY DTPGVFDGPD 
NLCITPHGGA LLCEDGDGLN YVVGLDRQGS PFAFAQNKIL FQDGADKIYR EFVGSCFSTN 
GRYLFVATQD PGIAYAVTGP WHTV