Gene Saro_2628 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2628
Symbol
ID	3917061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2864556
End bp	2865608
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	65%
IMG OID	640445405
Product	glycosyl transferase family protein
Protein accession	YP_497898
Protein GI	87200641
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGGCC GTCCGCCCGC CCTGTCCCGC ATCCCCGAGC ACCCCCGCGT CGCCGTCATC 
GTGCCAGCAT ATGGCGTGGC TCACCTTGTC GGCGAGGCGT TGCGATCTCT CCAGCGCCAG 
ACTCTGGAAG AGTGGGAATG CGTGGTGATC GACGACGGGG CACCCGACGA TGTTACCGCA 
GCCGTAGCTC CATTCCTCGA TGACCGCCGC ATCCGCTTCC TCGCCACGCC GAACGGCGGC 
GTGTCTGCGG CACGGAACCG GGCCATCGCC GCATCTTCGG CACCCCTGAT CGCCTTGCTC 
GACGGGGACG ACCTTTTCCG TCCTTCATAT CTCGAAACGA TGGTAGCGGT TCTGGAGGCT 
GACGCGGAAG CACGGCTCGC AACCTGCAAC GCCCGAATCT TTGGTGCGGT CGCGCGCGAG 
CGCACATGCG TGGAGCGCCG CCAGGGCAGC GGCGACGGCA CGAAGGGCTC ACTCGCCGAC 
GTGCTCGATC GTTCCTTCAA CGTCTATATC GGGACGACCT TTCGCCGGGC AGACTTCGAG 
CGGGTCGGCG GCTTCGACAC GACCATGGCG CAATCCGAAG ATTTCGATCT GTGGGTCAGG 
CTGATGATGC TGGGCGGACA CGCGCACTAT GTCGATGCGG TTCTCGGCGA TTACCGCGTA 
CGCCCTGGCT CGGCTTCCAG CAACGCGGGC AGGATGCTTC TCGGCAACAT CAAGGTATAC 
GAGAAGGCCC GCTCACTCCT TGCACCGGAC CGACCGGAGC GTGAGCTGAT CGAACGCCTC 
ATCGCCGATA ATCGCGCTTC CCTGGATTTC GAGCACGCGA TGGATCGCAT CATCGACGGG 
GACGCGCGAA AGGGAATCGC GGAGCTGAAG AAATCGGTGG CAGCAGGCCA GATGGTCGGC 
GGCCCGGTCT GGCGCCTCGC GTTTCTCGTC TGGCAACTAT TCCCCTCCCT GGCGAGGCCG 
ATGCTGCGTT GGCGGAGACG GGCGCACAGT CGCGGCGGTT CAGGCGTGGG CGGATCGGCC 
ATGTTCACCA GCTTCGTGGA GATCGAGGGG TGA

Protein sequence

MNGRPPALSR IPEHPRVAVI VPAYGVAHLV GEALRSLQRQ TLEEWECVVI DDGAPDDVTA 
AVAPFLDDRR IRFLATPNGG VSAARNRAIA ASSAPLIALL DGDDLFRPSY LETMVAVLEA 
DAEARLATCN ARIFGAVARE RTCVERRQGS GDGTKGSLAD VLDRSFNVYI GTTFRRADFE 
RVGGFDTTMA QSEDFDLWVR LMMLGGHAHY VDAVLGDYRV RPGSASSNAG RMLLGNIKVY 
EKARSLLAPD RPERELIERL IADNRASLDF EHAMDRIIDG DARKGIAELK KSVAAGQMVG 
GPVWRLAFLV WQLFPSLARP MLRWRRRAHS RGGSGVGGSA MFTSFVEIEG