Gene Paes_1945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Paes_1945
Symbol
ID	6459998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prosthecochloris aestuarii DSM 271
Kingdom	Bacteria
Replicon accession	NC_011059
Strand	-
Start bp	2126227
End bp	2127600
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	51%
IMG OID	642725930
Product	Cysteine synthase
Protein accession	YP_002016604
Protein GI	194334744
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG0031] Cysteine synthase [COG3620] Predicted transcriptional regulator with C-terminal CBS domains
TIGRFAM ID	[TIGR01137] cystathionine beta-synthase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCAGC AGAATATATT CTCGATGAAC GCTCAGGTGC CGATGGTTGC CATCAAGCGG 
CTGGCAGCCC ATATACAGCC GGAAATAGTT GCACGACTCG AGTATCTCAA TCCTTCCGGG 
ACCCATTACT GGTCTGTTGC ATCCGTGATT ATCGAAAATG CTGAAAAAGA GGGGCTCATT 
TCGCCTGGAA TGACCCTGGT CGACTGGACA TACGGCAGCA GCGGTATTGC ACTGGCAATG 
GCCGCGATAG CTAAGGGCTA TAAGGTTCTG CTTGTCGTGC CGGACAAGAT ATCACGCGAA 
AAGCAGCAGG TGCTGAAAGC CATGGGAGCC GAAGTTGTTA TCACGCCTTC TGATGCGCTG 
CCGGGAGCGC CGAGAAGTTG CGTCAATGTT GCGCAAAATC TGGTGCAGAA CCTCAAGCAT 
GCGTATTTCA CCAATATGTA TGAAAACCCT CTGAGTTTCA GCGTTCACGC TGAGACCACC 
GGCCCTATGA TATGGGAGCA GACCGGAGGG GAGGTCACGC ATCTTTTTGT TCCTGTGACA 
TCGGGAGCGA TGATTTCGGG TATAGGACAA TTTCTGAAGT CGAAACGGCA GAATATCAGG 
ATTATCGGTG TTGAGCCGGA GGGATCGATC TACAGGGAGC TGTTGCAGCA TCGCAAGCTC 
TCTGCGCCGG CACTGTTCGA GCTGGAGGAG ATAGGAGGAT TATGGGAATC GAAATACTGG 
GATGCTTCGG TGATCGACGA TATCGTTCAG GTCAGCGATT TCGATGCCTT TAACTGCGGT 
CGTGAACTTC TGCGTTCAGA GGCGATTTTT TCTGGAGGAT CATCCGGCGC AGCGATGTTT 
GCAGCGCTCA GGGCCGGTGC ACATCTTGGC CGGGATGCCC GGATCGTTGT CATGATGAGT 
GATTTTGGCG GCTACTACCT CAGTAAGATG TACAGCGATG AATGGATGAA GCTCAAAGGG 
TTTTACAGAA AAGCGCCATC TTCCAGAGAT GAGATTACCG CAGAGGATAT TCTCGGGCTC 
AAAACCCGCA GGGATCTTAT CTTCGCCCTT CCCGAGCATA CGCTTTCGGA AGTGTTTGAA 
ATGATGCGTC AGAACGACGT TTCGCAGCTG CCGATTGTCT CCTATGGGAC AGCGATCGGA 
AGTATCAGCG AAAACAAGAT TCTCTCGATT CTGATTGAAA ACGACGATGC CATGAATTCC 
AAGGTTGTCG GCTATATGGA ACAGCCATTT CCGGTCTGTC CGCCACATGC CACTATTTCG 
GAGTTGTCTG AAAAACTGCA GGAAAATGCT TCGGGCGTTC TGATAAGTCT TTCGGATGGT 
CGATTGCAAC TTCTTACGAA ATCTGACCTT ATAGAAGCGC TTACACATAA ATGA

Protein sequence

MLQQNIFSMN AQVPMVAIKR LAAHIQPEIV ARLEYLNPSG THYWSVASVI IENAEKEGLI 
SPGMTLVDWT YGSSGIALAM AAIAKGYKVL LVVPDKISRE KQQVLKAMGA EVVITPSDAL 
PGAPRSCVNV AQNLVQNLKH AYFTNMYENP LSFSVHAETT GPMIWEQTGG EVTHLFVPVT 
SGAMISGIGQ FLKSKRQNIR IIGVEPEGSI YRELLQHRKL SAPALFELEE IGGLWESKYW 
DASVIDDIVQ VSDFDAFNCG RELLRSEAIF SGGSSGAAMF AALRAGAHLG RDARIVVMMS 
DFGGYYLSKM YSDEWMKLKG FYRKAPSSRD EITAEDILGL KTRRDLIFAL PEHTLSEVFE 
MMRQNDVSQL PIVSYGTAIG SISENKILSI LIENDDAMNS KVVGYMEQPF PVCPPHATIS 
ELSEKLQENA SGVLISLSDG RLQLLTKSDL IEALTHK