Gene GM21_2009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2009
Symbol
ID	8137343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2329899
End bp	2331047
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	64%
IMG OID	644869622
Product	Cystathionine gamma-lyase
Protein accession	YP_003021819
Protein GI	253700630
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1.35589e-20
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGATCG CAACCGAAGC AGCACAGATA GGCCTGCAGC GCGACACCCG CACCGGTGCG 
GTGACCGTCC CCATCTATCA GACCGCCACC TTCCGCCACC CTGGGCTTGG GCAAAGCACC 
GGCTACGACT ACAGCAGGTC GGGAAACCCG ACGCGCCAGG CGTTAGAGGA AGGGCTCGCG 
GTGCTGGAGG GAGGGTGCCG CGGCTTCGCC TACGCCTCGG GGATGGCCGC CATCACGAGC 
CTCATGTTCC TCTTCAAGCA GGGGGACCAC CTGATAGTGA CCGAGGACCT CTACGGCGGG 
AGCTATAGGC TCTTCGAGAA GTTGTTCCAG CAGTTCGGGC TCAGCTTCAG CTACGTCGAT 
ACGAGCGATA TCGAGCTGGT GCGCCAGGCC GTGAGGCCCA ACACCCGCGC GCTCTTCGTG 
GAGTCGCTCA CCAACCCGCT TTTGAAGGTG GCCGACATTG AGCGACTGGC GGCCCTGTGC 
AAAGAGCGCG AGATGCTCTG CATCGTGGAC AACACCTTCC TGACCCCGTA TCTCTTGCGC 
TGTCTCGACC TGGGCGCCGA CATCACCGTC TATTCAGGGA GCAAGTACCT GGCCGGCCAC 
AACGACACCG TCTGCGGCCT GGTGGCGGTG AAGGACCCGG CGCTCGCCGA GCAGGTCTAC 
TTCCACCAAA ACGGCGCCGG CGCGGTCCTG GGCCCGCAGG ATTCCTGGCT CACCGTCAGG 
GGGATCAAGA CCCTCACCAT CCGCATGGAC CGGCAGCAGG AAAACGCCCT TGCCATAGCT 
AACTGGCTGA GCCTCCACCC GCAGGTGGTA AAGGTGCATT ATCCCGGCCT TCCCGATCAC 
CCCGGGCACG AACTGATGAA ACAGCGCGGC AAAGGTTTCG GCGCCATGAT TGCCTTCGAG 
GTGACCGAGC CGCACCTGGT CGACACGCTG CTGATGAAGA CCCGCCTGAT CTCCTTCGCC 
GAGAGCCTGG GCGGGGTCGA GAGCCTGATC ACCTTCCCCG CGGTGCAGAC CCACGCGGAC 
ATCGAGCCGG AGACGCTGAA GCGGCTCGGC ATCAACCATT CACTACTCCG CCTTTCGGTG 
GGGATAGAAG ACAAGGACGA CCTGATCGCC GACCTGGCGC AGGCGTTCGC AGGAGGAGAA 
CCGCAATGA

Protein sequence

MKIATEAAQI GLQRDTRTGA VTVPIYQTAT FRHPGLGQST GYDYSRSGNP TRQALEEGLA 
VLEGGCRGFA YASGMAAITS LMFLFKQGDH LIVTEDLYGG SYRLFEKLFQ QFGLSFSYVD 
TSDIELVRQA VRPNTRALFV ESLTNPLLKV ADIERLAALC KEREMLCIVD NTFLTPYLLR 
CLDLGADITV YSGSKYLAGH NDTVCGLVAV KDPALAEQVY FHQNGAGAVL GPQDSWLTVR 
GIKTLTIRMD RQQENALAIA NWLSLHPQVV KVHYPGLPDH PGHELMKQRG KGFGAMIAFE 
VTEPHLVDTL LMKTRLISFA ESLGGVESLI TFPAVQTHAD IEPETLKRLG INHSLLRLSV 
GIEDKDDLIA DLAQAFAGGE PQ