Gene Saro_0727 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0727
Symbol
ID	3918551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	768182
End bp	769204
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	67%
IMG OID	640443459
Product	KpsF/GutQ family protein
Protein accession	YP_496008
Protein GI	87198751
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.516394
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACAA GGTTCGACAG CGATCCCTTC GAGCCGGTCG CGACAGAGGC GGTCACCCGA 
TCGATTCCGC CCCGCAAGAT CGGTCGTGAG GTCGTGATCG CGGAAAGCGC AGGGCTTGCT 
GCACTTGCCG AGGCGCTGGA TGCCTCGTTC GACGCTGCGG TGAGTCTACT GCATTCCGGC 
GGCGGTCGCG TGTTCGTGAG CGGGGTGGGC AAATCGGGCC ACGTCGCCCG AAAGATAGCC 
AGCACCTTAT CGTCCACCGG TCGTCCGGCG TGCTTCATTC ATCCGGTGGA GGCCATGCAT 
GGCGATCTTG GAATGCTGTG CCCCGGGGAC GTGCTGATCG TGCTGTCCAA TTCGGGAGCG 
TCGATGGAAC TGCGCGGCCT AGTCGACCAT GCGCAGCGTC TTTCGGCAAG GATCGTGGCG 
ATCGGGGCCC GGCCGGACTC TCCGCTGATG CGGGTGGCGG ACATCGCGCT CGTCATTCCC 
GATGGCCCCG AAGCATGCCC GGTCAACATT GCGCCAACCA CATCGACCAC GATGATGCTG 
GCACTGGGCG ATGCGCTTGC CGTGGCTGTG ATGAGCGCGC GCGGCATCGG GGTAGAGCGC 
ATCAGGCTGC TCCACCCGGG AGGCCCGATC GGAGAGCGGC TCCGCGTCGC GGAGGACGTG 
ATGCGAACCG ACGCCCTGCC GCTGGTGGGG GTCGAGGACC CGATGCCCGA AGTGCTGTTG 
TGCATGGCGC GATCAGGCCT CGGAATCGCG GGCGTGGTCG CCTTGGGTGG AGGACTGGTC 
GGCGTGATCG AGGCGGACAG GCTGCCAGCC GTGGCCCGCG ACCTCGCCGG GGAGCGGGCC 
GGGTTTTTGA TGAACCGCCA CGCCTGGGTC GCAAGGCGGG AAACGCCCTT GGACGAAATC 
GCCCGGAACC TGGGTGTCGG CGGGAGCGAT GCGGCCCTCG TGATTGCGGG CGAGAACGAT 
CGCAGGCCGA TCGGCGTCGT CAGCGCTCGG AACCTCGGCA CGTCGGGAGC GTGGCCGGCA 
TGA

Protein sequence

MKTRFDSDPF EPVATEAVTR SIPPRKIGRE VVIAESAGLA ALAEALDASF DAAVSLLHSG 
GGRVFVSGVG KSGHVARKIA STLSSTGRPA CFIHPVEAMH GDLGMLCPGD VLIVLSNSGA 
SMELRGLVDH AQRLSARIVA IGARPDSPLM RVADIALVIP DGPEACPVNI APTTSTTMML 
ALGDALAVAV MSARGIGVER IRLLHPGGPI GERLRVAEDV MRTDALPLVG VEDPMPEVLL 
CMARSGLGIA GVVALGGGLV GVIEADRLPA VARDLAGERA GFLMNRHAWV ARRETPLDEI 
ARNLGVGGSD AALVIAGEND RRPIGVVSAR NLGTSGAWPA