Gene Saro_1804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1804
Symbol
ID	3918363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1902515
End bp	1904047
Gene Length	1533 bp
Protein Length	510 aa
Translation table	11
GC content	65%
IMG OID	640444545
Product	hypothetical protein
Protein accession	YP_497078
Protein GI	87199821
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.130645
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATA CTGGCGGTGT CATCGGTGTA CGCGCCGCCA TTCCCATGCC TGTACGCGCC 
GCAGCGGTCC TGCGGCCGTT GCAGATCCCG GACTGGCTGG CCACTGCCCT CGCCTATCTC 
TGCCTGGTGC TGCTTACGCG CGGGTTCCTG ATCGGCAATC CCGTCATCCA CATCGACGAA 
CAATTCTACC TGTTCGTGGC CGAACGGATG CGCGACGGGG CGATCCCCTA TGTCGACATC 
TGGGACCGCA AGCCCATCGG GCTGTTCCTT GTCTACGAGG CGCTGTCGCT GATCCCAGGC 
GATCCGGTGC TAGGCTATCA AGCCGGAGCC ATTCTGGCGA CGATGGGCAC GGCGATGGTC 
ATCGCCCGCC TCGCCCGGGA AATCGCCTCG CCGGCCGCGG CATGGCAGGC GGGCGTTGCC 
TATATCCTGT TCATGCCCGC CTTCAACGCG GCAATGGGAC AGGCGCCGGT ATTCTACAAC 
CTGTTCGTGG CACTGGCCGC CCTGGGCGTG GTCGACACGG TCAAGAAATA CGAGAGCGAC 
GCCCTGATCT GGCGCGGCTG CGCGATCATG CTGCTGCTGG GGCTGGCGAT CCAGATCAAG 
TACACCGTGG TGTTCGAGGG CATGGCCTTC GGCCTGATCC TGCTGTCCCG CGCCTTTGCC 
GACGTATGGA GCTATCGCCG CCTCGCTGCC GTCGCGGTGC TGTGGATGGC GGTCGCCCTG 
CTGCCTACCG CCGCCGCCGC CGCGTGGTAT GCCGCGCACG GCTACCTCGA CCAGTTCGTC 
TATGCGAACT TCCTCTCGAT CTTCGAACGC GAGTCCGACG GCTGGCGCGC GCCCTGGCGC 
CTGACCAAGG AAATGGCCGC GCTGCTGCCG TTCTGGTTCG CGATCTTCCG GGCACCCAAG 
CTGTTCGACG CGACCGACGG GCAGCATCCG CGCTCGCATG CCGTGCTCAA GGTCTGGGGG 
ATGGCAGCGT TCGCGGGCTT CATCCTGTTC GGCACCTGGT ACGACCACTA CGTCGCGCCG 
CTGCTGGTCC CGCTCTCCAT CCTCGCGGCG CCGGCCCTCG CGCGGATCGT GCCTTCCGAG 
CGCGGCATCG GGCGTTTCCT GCTAGGCTTC GGTGCGCTCG CCAGCGTTGT CGTTCCCGGT 
TTCCAGGTGT GGAAGCATGG CACCGCCGGT CAGTACGAAC GGATGCAAGC GCTGATCGAG 
CGCGAAATGC GCGGCGGATG CCTCTACATC TACGAGGGCG AACTGGCGTT CTATCGCACG 
ACCAATTCGT GCCTGCCGAC GACCCGGATC TTCCCGAACC ACCTCAATAC CTTTGTCGAG 
GCGCCGGCGA TTGGCGTCGA TCCGGTCAGC GAAGTGCGCA AGGTGCTGGC ATCGAAGCCC 
GACGTCATCC TGATGTGGGC CCCGGCACGC CTCTACCTGC CCAATCATGA AACCCGCCGC 
ATCGTGACCG CGACGCTCCA GCAAGACTAC GAGCGTTATG CCTCGTTCAC GCTGGGGACG 
CGGGTGTACT GGCTTTACCG CCCACGGCGC TAG

Protein sequence

MSDTGGVIGV RAAIPMPVRA AAVLRPLQIP DWLATALAYL CLVLLTRGFL IGNPVIHIDE 
QFYLFVAERM RDGAIPYVDI WDRKPIGLFL VYEALSLIPG DPVLGYQAGA ILATMGTAMV 
IARLAREIAS PAAAWQAGVA YILFMPAFNA AMGQAPVFYN LFVALAALGV VDTVKKYESD 
ALIWRGCAIM LLLGLAIQIK YTVVFEGMAF GLILLSRAFA DVWSYRRLAA VAVLWMAVAL 
LPTAAAAAWY AAHGYLDQFV YANFLSIFER ESDGWRAPWR LTKEMAALLP FWFAIFRAPK 
LFDATDGQHP RSHAVLKVWG MAAFAGFILF GTWYDHYVAP LLVPLSILAA PALARIVPSE 
RGIGRFLLGF GALASVVVPG FQVWKHGTAG QYERMQALIE REMRGGCLYI YEGELAFYRT 
TNSCLPTTRI FPNHLNTFVE APAIGVDPVS EVRKVLASKP DVILMWAPAR LYLPNHETRR 
IVTATLQQDY ERYASFTLGT RVYWLYRPRR