Gene GM21_3745 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3745
Symbol
ID	8139119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4314436
End bp	4315656
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	62%
IMG OID	644871364
Product	argininosuccinate synthase
Protein accession	YP_003023522
Protein GI	253702333
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	130
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGA AAGAAGTGAA AAAGATCGTC CTCGCCTACT CCGGCGGGCT TGACACCTCC 
ATCATCCTGA AATGGCTCAA AAACGAGTAC GGCTGCGAAG TGGTCACCTT CTCCGCGGAC 
CTGGGACAGG GGGACGAGCT GGAGCCGGTC CGCGAGAAGG CGTTCAAGAC GGGCGCCGAC 
AAGGTCTACA TCGACGACCT GCGCGAAGAG TTCGTGCGCG ACTTCGTGTT CCCGATGTTC 
CGCGCCAACG CGATCTACGA AGGGTCGTAC CTGCTCGGCA CCTCCATCGC GCGCCCGCTG 
ATCGCGAAAC GCCAGATGGA AATCGCCCAG ATCGAGGGTT GCGACGCGGT CTCCCACGGC 
GCCACCGGCA AGGGTAACGA CCAGGTCCGC TTCGAGCTCG CCTACTACCA CTTCAACCCC 
GGCATCACCG TCGTGGCACC GTGGAGGGAA TGGAAGCTCA ACTCCCGCCA GGCGCTGATC 
AACTACGCGA AGAGAAACGA CATCCCGATC CCGATCACCA AGAAGCGCCC CTGGTCTTCC 
GACAGGAACC TGCTGCACAT CTCCTTCGAG GGCGGCATCC TGGAGGACAC CTGGCTGGAG 
CCCCCCGAGA ACATGTTCGT GCTGACCAAG CCGCCCGAAA AGGCGCCGAA CAAGCCGCAG 
TACGTCGAGA TCGAGTTCGA GAAGGGTAAC GCTGTGGCTG TCGACGGCGT GCGCATGTCC 
CCGGCTGAGC TTCTGGCTCA CCTGAACACC ATCGGCGGCG AGCACGGCAT CGGCCGCGTC 
GACCTCCTGG AGAACCGCTC GGTCGGCATG AAGTCCCGCG GCGTCTACGA GACCCCGGGC 
GGCACCATCC TGCGCGAGGC GCACATGGCC GTCGAGCAGA TCACCATGGA CCGCGAAGTC 
ATGCATCTGC GGGACTCCCT GATCCCGCGC TACGCCGAGA TGATCTACAA CGGCTACTGG 
TTCTCGCCGG AGCGCGAGAT GATGCAGTGC ATGATCGACG AGTCCCAGAA GACGGTGAAC 
GGCGTGGCGA GGCTGAAGCT CTACAAGGGT CACTGCCGCA CCGTGGGCAG GAAGTCCGAG 
AGCGACTCGC TCTTCAACCT CGACTTCGCC ACCTTCGAGA AGGATCAGGT CTACAACCAG 
GCGGACGCCG AGGGCTTCAT CAAGCTGAAC TCCCTGAGGC TCAGGATCCG TTCGCTCATG 
CTGGCCAACA AGAACAAGTA A

Protein sequence

MAKKEVKKIV LAYSGGLDTS IILKWLKNEY GCEVVTFSAD LGQGDELEPV REKAFKTGAD 
KVYIDDLREE FVRDFVFPMF RANAIYEGSY LLGTSIARPL IAKRQMEIAQ IEGCDAVSHG 
ATGKGNDQVR FELAYYHFNP GITVVAPWRE WKLNSRQALI NYAKRNDIPI PITKKRPWSS 
DRNLLHISFE GGILEDTWLE PPENMFVLTK PPEKAPNKPQ YVEIEFEKGN AVAVDGVRMS 
PAELLAHLNT IGGEHGIGRV DLLENRSVGM KSRGVYETPG GTILREAHMA VEQITMDREV 
MHLRDSLIPR YAEMIYNGYW FSPEREMMQC MIDESQKTVN GVARLKLYKG HCRTVGRKSE 
SDSLFNLDFA TFEKDQVYNQ ADAEGFIKLN SLRLRIRSLM LANKNK