Gene Saro_2320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2320
Symbol
ID	3915665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2463922
End bp	2465049
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	66%
IMG OID	640445076
Product	hypothetical protein
Protein accession	YP_497591
Protein GI	87200334
COG category	[S] Function unknown
COG ID	[COG3828] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAAGG CGTTGGTGCG GGCTGCCTGC CTGATGACGG GGGCGGCGGT GTTGGGTGCG 
GGCGGTGCAA GCGCTACGCC CGTAACGGAT TGCCCGCTGG GCCGACAGGC GCTTTCCACG 
GCCTCTCCAC TGAGCGACGT CCTGGCGGTT CCGCGGGCGC GGGCTGTACT GGATGAAGCA 
TCGCCCGGGC TTGTGGAGGC GCTGACCAAG CCTTTCGGCG GAGGGACGCT GCCCCCCGGT 
TTCGACCGTA TCGTCACGCC GAAGGCTCTA CTCGGCATGG CGGGGAAGGG CGATGCTGCC 
TTCCTGACGA AGCTCGACGC GGCATTGGGG CGGATCAGGT TGACCAGGGC CGATGTCGTC 
GCCCGCTGCG CCAGTTATGA CAACGAGCGG CCGGCGCTTC CTGCGAATCT GGCGCGCCCG 
GCGATCCTCG TATTCGGCAA GATCACCGGG TTTCGCGATG CGCCTTCGGT GGACGCTGCC 
GAGACCGCGC TGAAGGACAT TGCCGCGCGG CATGGCTGGG GACTGGTGTT CACCGACAAG 
GGTGGCGTGT TCAACGCGGC CGACCTTTCG CGCTTCGATG CGGTGGTGTG GAACAACATC 
AGCGGCGATG CCCTGACGAT CCCACAGCGC GCGGCATTCC GCAAGTGGAT CGAACGCGGC 
GGCGGCTATG CCGGCATCCA CGGTTCCGGC GGCGATCCGC AGTTCTTCTG GGACTGGTAT 
GCCGATACAC TGGTGGGTGC GCGGTTCATC GGGCACCCGA TGGCGCCGCA ATTCCAGGAA 
GCGCGCGTGG TCGTCGAGGA CAAGGCGCAT CCGGCCGCGT ACGGTCTTCC GTCGGAATGG 
CGCATGACCG AGGAGTGGTA TTCCTTCGAT CGCAGCGTGC GCGGCAAGGC GCGGGTGATC 
GCTTCGCTTG ATGAAAGCAG CTACAATCCG GGCGAGGGTT TCGGTCGCAA GCTGTCGATG 
GGCGACCATC CGATTGCGTG GTCGCAGTGC GTGGGCAGCG GGCGCAGTTT CTATACTGCT 
ATCGGCCACC GCCCGGAGAG CTATGTCCAG CCCGAGAGCG TGAAGCTGCT CGAACAGGGC 
ATCCTGTGGG CGGCGGGGCT GGCGCCCGAG GGCTGCGGCG GAAAGTGA

Protein sequence

MLKALVRAAC LMTGAAVLGA GGASATPVTD CPLGRQALST ASPLSDVLAV PRARAVLDEA 
SPGLVEALTK PFGGGTLPPG FDRIVTPKAL LGMAGKGDAA FLTKLDAALG RIRLTRADVV 
ARCASYDNER PALPANLARP AILVFGKITG FRDAPSVDAA ETALKDIAAR HGWGLVFTDK 
GGVFNAADLS RFDAVVWNNI SGDALTIPQR AAFRKWIERG GGYAGIHGSG GDPQFFWDWY 
ADTLVGARFI GHPMAPQFQE ARVVVEDKAH PAAYGLPSEW RMTEEWYSFD RSVRGKARVI 
ASLDESSYNP GEGFGRKLSM GDHPIAWSQC VGSGRSFYTA IGHRPESYVQ PESVKLLEQG 
ILWAAGLAPE GCGGK