Gene Francci3_1774 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1774
Symbol
ID	3904004
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2110335
End bp	2111411
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	70%
IMG OID	637879112
Product	sulfotransferase domain-containing protein
Protein accession	YP_480879
Protein GI	86740479
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.588183
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCCG CCGTTCCACC ACCTGGGTCG GCGCGCCCTG TCCTGATTAT TGGTACTGAG 
CGATCCGGGT CGAATCTTCT GCGGCTCATG CTCGACGCAC ACCCCGCCAT CGCGGTCCCG 
CACCCGCCGC ACCTGATGAG GTACCTGGCC CCGCTGGCAG CGTCCTACGG AGACCTCGGT 
GTTGCGGCCA ACCGCACACG GCTGGCCCGC GACGCGCTGC GGATCGTGCG TGCTCACCTG 
CATCCTTGGC CGCATCCGGT AGATCTCGCA CGCGTGGTCC GCGAGTCCGA CGCCTCCACG 
TTCGGCGTTG TAGCCGCGAT CTACGAACAG TACCGCGAGG CCGAGGACAA GCCGCGGTGG 
GGGTGCAAGA GCACGTTCAT GGTCGACCAC ATCGACGAGG TGCTACGCCG CTATCCCGAC 
GCCCGGTTCG TCTGGCTGGT CCGGGATCCC CTAGACGTCG CTGCCTCGGC CAAGCGTGCG 
GTCTTCGGCC CAAGCATGCC CTATCGGATG GCCCGGCTAT GGCTACGCGA GCAGCGGTGC 
GCGGACGCGG CGCTGGCGCG GCACGGGCCC GCGGTGGTAT ACCTGCTTCG CTACGAGGAC 
TTGGTGACCG AGCCAGAGGG CGCGTTGAAC GAACTCTGCT CCTTTCTCGG CGAGCCCATG 
CATGCCGGGA TGTTGCACCA TCATCTCACA TCGGGGGCGC GTCGGATCGG CGCGCTCGCC 
GAGTCTTGGA GACGGGCCGC GCAGCCGGTC GGCGCCGACC GGATCGGCGC GCACCGCACC 
GGCCTGACCG CCGCCGAGCG TAGGCAGGTG GCTGCGGTGG CTGCACCGCT GGCCCGGCGG 
CTGGGCTACG ACCATGGCTC GGACGCCGAC GCCGCGCCGG AGGAGGTGGC GCCTTCGATG 
GTCGCCATGG CGCTGCGCTC GGCTGGACTG CGCACCGTGA TCGAGGTGCG TTCGTTGTGC 
CGGGACCGTA ACTACACCCG TAGGCTCCGG CGCGACGCGA CGGTGCGCTC GCTGCGGCTG 
ACAGCGTGGG CGCGCACCCG GGTGCCAATG GAACTGCCCC AGTTGAGAAC CCGGTGA

Protein sequence

MSAAVPPPGS ARPVLIIGTE RSGSNLLRLM LDAHPAIAVP HPPHLMRYLA PLAASYGDLG 
VAANRTRLAR DALRIVRAHL HPWPHPVDLA RVVRESDAST FGVVAAIYEQ YREAEDKPRW 
GCKSTFMVDH IDEVLRRYPD ARFVWLVRDP LDVAASAKRA VFGPSMPYRM ARLWLREQRC 
ADAALARHGP AVVYLLRYED LVTEPEGALN ELCSFLGEPM HAGMLHHHLT SGARRIGALA 
ESWRRAAQPV GADRIGAHRT GLTAAERRQV AAVAAPLARR LGYDHGSDAD AAPEEVAPSM 
VAMALRSAGL RTVIEVRSLC RDRNYTRRLR RDATVRSLRL TAWARTRVPM ELPQLRTR