Gene Saro_3995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3995
Symbol
ID	5077525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	-
Start bp	163015
End bp	164469
Gene Length	1455 bp
Protein Length	484 aa
Translation table	11
GC content	64%
IMG OID	640481100
Product	TraH family protein
Protein accession	YP_001165762
Protein GI	146275601
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGCCC GTCGCTTCGC CCGCCGCCTC CATGGAGCCT CGCGCCGCGC ACTTGGCACA 
GTCCTCGGTG CCGCGGTTCT GCTCGCTTCG CCCACACCCG CCTCGGCCGG GGTCGAAGGC 
GAGATGCAGA GCTTCATGTC CGACATGGGC GTCCAGGCCA ATGTCACCGG TCCCAGCGCC 
TACCAGGGCC AGTCGGCGGG CTATTATTCG ATGGGCTCGG TCTGGTCGCG CTTCCCGCAA 
AAGAACATCC AGCCCTTCAA CCTCCAGTTG CCCCACGCGC GCGCCGGGTG CGGCGGCATC 
GACCTCTTTG CCGGGTCGTT CTCGTTCATC AACACCGCCG AACTTGTCGC CATGCTGAAA 
GCGACCGCGA ACAACGCGCT CGGCTTTGCC TTCAAACTCG CGATCGACAC GATCTCGCCC 
GAGATCGGCA AGGTCATGGA TGAGCTGGCG CAGAAGGTTC AGCAGATGAA CCAGATGAAC 
ATCTCGTCCT GCGAGACCGC GCAGGCGCTG GTCGGCGGCC TCTGGCCGAA GAGCGATACG 
GCGAGTTCGG TCATCTGCGA GGCGATCGCC AACAGTCAGG GCGCGGTCTC CGACTGGGCC 
CGCGCGCGCC AGCAGTGCAA CAACGGCGGC CAGCGCGAAG CCTTGAAAAG CGCCAATTCC 
GACCCGGACA TGAAGGAACA GGCCGGGATG CCCAACAATT ACACCTGGGC GGCATTGGGC 
AAGAAATACG GTGGGTTCGA CACCCAGTTC CGCGAGTTCC TGATGACCCT CGTCGGGACC 
GTGATCTACG ATCCGGCCGG TAATGGCGGC AAGCCGAGGG TCCAGTTCAT CGGCCCGGCC 
GACCCGGCGC TGATCAGCGC CATGCTCGAC GGCACCTCTT CCACCCCGCA CAAATACTGG 
AGCTGCGGCG GCGATAGCGC CAAGTGCATG GCGCCGAGCG AGATCGACAT GGTGATCGGG 
CCTAATGCAG CGATCAAGGC GCGGGTGCGC ACGCTGATCG AGAGCATGGC CTTGAAAGTG 
CGCGATCCCG GCGCCTCGTT GACCCCGGCC GAGATCCAGC TCCTCGGCAT GGCGAGCGTG 
CCGGTCTACA AGATCATCAC CGTGAGCGCA GCGGCCGAGT TCGGCATCTC CGCGCAGGAG 
ATCAACGACC TTTCCGAAAT AGTCGCGGTC GATCTCGTCA CCACCATGAC CATGCGGTTC 
ATCGACATGG CAGTGAACGC GCGTTCGGAC TTCAACGGGG CTGATGCGGA TAGCTTACGC 
GAATGGCGCG AGGGGCTTTA CGAGACCCGG CGCAATTTCC TCGGGATCGC GGCGCGCACC 
TCGCAGCGCT TCGACCAGAC CTTTGCGCTG ATCCAGCGCA CGCAGATGCT CGAAAAGACC 
CTGCGTACCC AGCTCTCGCC CCAGATGTCG GCCGCGCTGC GCTTTTCGCG CACGCTCGGC 
AGCCAGGTCC AGTAA

Protein sequence

MRARRFARRL HGASRRALGT VLGAAVLLAS PTPASAGVEG EMQSFMSDMG VQANVTGPSA 
YQGQSAGYYS MGSVWSRFPQ KNIQPFNLQL PHARAGCGGI DLFAGSFSFI NTAELVAMLK 
ATANNALGFA FKLAIDTISP EIGKVMDELA QKVQQMNQMN ISSCETAQAL VGGLWPKSDT 
ASSVICEAIA NSQGAVSDWA RARQQCNNGG QREALKSANS DPDMKEQAGM PNNYTWAALG 
KKYGGFDTQF REFLMTLVGT VIYDPAGNGG KPRVQFIGPA DPALISAMLD GTSSTPHKYW 
SCGGDSAKCM APSEIDMVIG PNAAIKARVR TLIESMALKV RDPGASLTPA EIQLLGMASV 
PVYKIITVSA AAEFGISAQE INDLSEIVAV DLVTTMTMRF IDMAVNARSD FNGADADSLR 
EWREGLYETR RNFLGIAART SQRFDQTFAL IQRTQMLEKT LRTQLSPQMS AALRFSRTLG 
SQVQ