Gene Francci3_1556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1556
Symbol
ID	3904788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1865641
End bp	1866732
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	70%
IMG OID	637878893
Product	serine phosphatase
Protein accession	YP_480661
Protein GI	86740261
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.79241
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGCGCT GGTTCGCCCC GATCGCCCCG ATCACCCCGA TGCTCATACT CGCCCTGGTG 
GTCGGACTGC AACTGAGCAA CCAGAAATGG AACGTGATCG GACTCGCGAT TCTGAGCCCC 
ATGCTCGCGG CCACGTTCGC CGGACCCCGG CTGACCGCAG GCTACGGGGT GGCGGCGGTC 
CTGGCGGGCA TCCTGCTGGG TCTGCACGAT GACCTGTTCG GCCGGAGCGG CGGTGGCCCG 
ACGGCCCAGG TGGTCCGGCT GGTCGGGGTC ACGGCCGGCG GAGTGATGGC CGTCCTGGTC 
AGCCGATACA ACATCCGACG CGAGACGAAG CTGCAGAACG TCACTCGGGT GGCCGAGGTG 
GCGCAGCAGA CGATCCTCAG TCCCGTCCCG TCGTCGTCCG GCGGGCTGCG GTTCGCCGTC 
CGCTACGAGA GTGCCACCGT GGAGGCCATG ATCGGTGGGG ATCTGTACGA GGTCGTCGAC 
AGCCCGTGGG GAACCCGCCT GCTCATTGGT GACGTACGGG GCAAGGGGCT CGACGCCGTG 
CGGATCGCGA GCCGGGTGCT CAGCTGCTTC CGGCTGATGA GTCGACGCAC GGGCGGCCTG 
CGCGATCTGC TGGCGAACCT CGACGCGGAG GTCGCCGATG CCAGCTGCCT GGACGACTTC 
GTCACCGCGG TCGTCGGGCA GGTCGACGGC AGCCGTCTGA CGCTGGCGAA CGCGGGACAT 
CCCGATCCCG TTCTCGTTCG TGCCGGGCAG GCGGATCTGC TCACTGTCTC GTCCAGGCTG 
CCACCGCTCG GGCTGATCAC GGACGGGAGC AACGTGACGG ACACCGTGCT GCGGGCGGGG 
GATCGCCTGC TGTTCTATAC CGACGGCATC ACCGAGGCAC GCGCCCCCAC GACCGGCGCC 
TTCTTCCCCC TGCTGCCCGC GGCCGAGGCC GCGTTCGCCC ACACGTCACT CGACGAGGCG 
CTGACCGATC TCGCCGACCG GGTCCGGGAC TGGACGCGAT CGACGCTGAA CGACGATGTG 
GCGCTCCTGG CGGTCGAGGT TCCCGGACCG ACCCGGCACG CCGGCCCAAC CCGACGATCG 
GATGATCACT GA

Protein sequence

MLRWFAPIAP ITPMLILALV VGLQLSNQKW NVIGLAILSP MLAATFAGPR LTAGYGVAAV 
LAGILLGLHD DLFGRSGGGP TAQVVRLVGV TAGGVMAVLV SRYNIRRETK LQNVTRVAEV 
AQQTILSPVP SSSGGLRFAV RYESATVEAM IGGDLYEVVD SPWGTRLLIG DVRGKGLDAV 
RIASRVLSCF RLMSRRTGGL RDLLANLDAE VADASCLDDF VTAVVGQVDG SRLTLANAGH 
PDPVLVRAGQ ADLLTVSSRL PPLGLITDGS NVTDTVLRAG DRLLFYTDGI TEARAPTTGA 
FFPLLPAAEA AFAHTSLDEA LTDLADRVRD WTRSTLNDDV ALLAVEVPGP TRHAGPTRRS 
DDH