Gene Dgeo_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dgeo_2067
Symbol
ID	4058164
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Deinococcus geothermalis DSM 11300
Kingdom	Bacteria
Replicon accession	NC_008025
Strand	-
Start bp	2172594
End bp	2173838
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	65%
IMG OID	641231106
Product	argininosuccinate synthase
Protein accession	YP_605530
Protein GI	94986166
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.369104
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAACG TTCAGCAGGG TCAGAAAGAC AAGATCGTCC TCGCCTACAG TGGCGGCCTC 
GACACCTCCA TTATCCTCAA ATGGCTCCAG ACCGAGCGGA ACTACGACGT GGTGACCTTT 
ACCGCCGACC TTGGCCAGGG GGATGAGGTG GAGGAGGCGC GGGTGAAGGC CCTGAACACC 
GGTGCGGTCG CCGCCTACGC CCTTGACCTG CGTGAGGAGT TCGTGCGCGA CTACGTGTTT 
CCGATGTTCC GCGCCGCCGC GCTGTACGAG GGCTACTACC TGCTGGGCAC GTCCATCGCC 
CGGCCCCTCA TCGCGAAGAA GCTGGTCGAG ATTGCTGAGA AGGAGGGCGC AGTCGCCGTC 
TCGCACGGAG CGACCGGCAA GGGCAACGAC CAGGTGCGCT TTGAGATGAC CGCCTACGCC 
CTGAAGCCGG ACATCGTGAC CGTCGCGCCC TGGCGGGATT GGGACTTCCA GGGCCGCGCG 
GACCTCGAGA CCTTTGCTCG CGAGCACGGC ATTCCTGTCC CGACCACCAA AAAGGATCCT 
TGGTCCACCG ACGCGAACCT GCTGCACATC TCCTACGAGG GCGGCATTCT GGAAGACCCT 
TGGGCCGAGC CGCCCGCCCA TATGTTCAAG CTGACCGTCT CTCCCGAGGA GGCACCCGAC 
CAGCCCGAAT ATGTGGAGGT CGAGTTCGAG AACGGCGACC CGGTGGCCAT CGGCGGCGAG 
CGCCTCAGCC CCGCCGCCCT GCTGGCGAAG GCAAATGAGA TCGGCGGGCG CAACGGCGTG 
GGCCGCATCG ACCTCGTCGA AAACCGCTTT GTGGGCATGA AGTCGCGCGG TGTCTACGAG 
ACGCCCGGCG GCACGCTGCT CTACCACGCC CGCCGCGCCG TCGAGAGCCT GACCCTCGAC 
CGCGAGGTGC TGCACCAGCG CGATGCCCTC GCTCCCAAGT ACGCTGAACT GGTCTACAAC 
GGCTTCTGGT TTGCGCCCGA ACGCGAGGCA CTTCAGGTCT ATATCGACCA TGTGGCCCGC 
AGCGTCACCG GGACTGCTCG CCTGAAGCTC TACAAGGGCA ACTGCACCGT GGTGGGTCGC 
CGGGCGCCGC GCAGCCTCTA CGACAAGGAC CTGGTGTCTT TCGAGGCAGG CGGCGACTAC 
AACCAGCATG ACGCCGGGGC CTTTATCAAG CTGAACGCCC TGCGGATGCG GGTGCAGGCG 
CGGGTGGACG CCAAGAGGAC CCAGCAGGAA GTCGCGCGGG TTTGA

Protein sequence

MANVQQGQKD KIVLAYSGGL DTSIILKWLQ TERNYDVVTF TADLGQGDEV EEARVKALNT 
GAVAAYALDL REEFVRDYVF PMFRAAALYE GYYLLGTSIA RPLIAKKLVE IAEKEGAVAV 
SHGATGKGND QVRFEMTAYA LKPDIVTVAP WRDWDFQGRA DLETFAREHG IPVPTTKKDP 
WSTDANLLHI SYEGGILEDP WAEPPAHMFK LTVSPEEAPD QPEYVEVEFE NGDPVAIGGE 
RLSPAALLAK ANEIGGRNGV GRIDLVENRF VGMKSRGVYE TPGGTLLYHA RRAVESLTLD 
REVLHQRDAL APKYAELVYN GFWFAPEREA LQVYIDHVAR SVTGTARLKL YKGNCTVVGR 
RAPRSLYDKD LVSFEAGGDY NQHDAGAFIK LNALRMRVQA RVDAKRTQQE VARV