Gene Cag_1257 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1257
Symbol
ID	3748295
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1723872
End bp	1725146
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	50%
IMG OID	637773795
Product	O-acetylhomoserine/O-acetylserine sulfhydrylase
Protein accession	YP_379561
Protein GI	78189223
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2873] O-acetylhomoserine sulfhydrylase
TIGRFAM ID	[TIGR01326] OAH/OAS sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.251284
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTATC GTTTTGAAAC CCTTGCCCTT CATGCCGCTC AACCCGTTGA TGGAACGCTT 
TCGCGTGGAG TTCCCGTTTA CCGCACCACC TCGTACCTGT TTAAAAGCAC CGAACATGCC 
GCAAATCTTT TCGCTCTTAA AGAGTTGGGA AATATTTATA CCCGTTTAAT GAACCCCACC 
ACCGAGGTTC TGGAAGCTCG TATGACAGCA TTGGAAGGGG GCGTAGCTTC GGTTGTTGTA 
GCATCGGGCA CGGCAGCAAT TTTTAACACC ATTATTACTT TAGCCGAAGC GGGCGACCAC 
ATTGTATCGG CTAATAATCT TTATGGGGGA ACTTACACCC AATTCGATGC TATTTTGCCA 
AAGCTGGGCA TAACCACCAC TTTTGTAGAT CCAAAAGAGC CTGCCAATTT TGAGGCAGCA 
ATTACCGACA AAACAAGGGC GCTTTATATT GAAACAATTG GCAACCCCGT ACTTGACTTT 
ACCGATGTAA AAGCCATTGC CGATGTTGCC CACCGAAACG GCTTGCCACT GATTGTAGAT 
GGCACCTTTA CCACACCCTA CCTCTTACGC ACCATTGAGC TTGGGGCTGA TATTGTGATT 
AACTCGCTCA CCAAATGGCT TGGCGGACAT GGAGCAGCAA TTGGCGGCAG CATTACCGAT 
GCAGGGCGCT TTAATTGGGC AGCAGGCAAA CATCCGCTCT TTACCGAACC TGACGAAAAT 
TACCACGGCT TACGTTGGGC GCTCGACCTC CCTGAAGCCC TTGCCCCTAT GGCATTTGCC 
CTGCGTACTC GCACCGTACC ACTCCGCAAT CTTGGTGCCT GCATTGCCCC CGATAACTCA 
TGGCTGTTAC TGCAAGGCAT TGAAACATTG CCCGTCCGCA TGGAACGCCA TTGCAGTAAC 
GCCCTAACAG TGGCACAATT CCTTTCGCAA CACCCCACCG TTGCATGGGT ACGCTATCCA 
GGTTTACCAA ACGACCCCAC TTACGCAACC GCCTCACAAT ACCTGACTCG TGGCTTTGGC 
GGCATGGTGG TCTTTGGAGT AAAGGGCGGA TATGATGCCG CTGTAAAAAT TATTGATACC 
ATTGATCTCT TTTCGCACCT TGCAAACGTT GGCGATGCCA AAAGCTTAAT TCTCCATCCA 
GCAAGCACTT CGCATAGCCA GCTCACCCAA GAACAGCGCA TAGCAAGCGG ACTTTCCGAC 
GACCTTATTC GCCTCTCCAT TGGGCTTGAA CACCCCGACG ACCTTATTGA AGCCCTTGAT 
AAAGCCTTAC AATGA

Protein sequence

MTYRFETLAL HAAQPVDGTL SRGVPVYRTT SYLFKSTEHA ANLFALKELG NIYTRLMNPT 
TEVLEARMTA LEGGVASVVV ASGTAAIFNT IITLAEAGDH IVSANNLYGG TYTQFDAILP 
KLGITTTFVD PKEPANFEAA ITDKTRALYI ETIGNPVLDF TDVKAIADVA HRNGLPLIVD 
GTFTTPYLLR TIELGADIVI NSLTKWLGGH GAAIGGSITD AGRFNWAAGK HPLFTEPDEN 
YHGLRWALDL PEALAPMAFA LRTRTVPLRN LGACIAPDNS WLLLQGIETL PVRMERHCSN 
ALTVAQFLSQ HPTVAWVRYP GLPNDPTYAT ASQYLTRGFG GMVVFGVKGG YDAAVKIIDT 
IDLFSHLANV GDAKSLILHP ASTSHSQLTQ EQRIASGLSD DLIRLSIGLE HPDDLIEALD 
KALQ