Gene Athe_1249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1249
Symbol
ID	7409723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1338827
End bp	1340038
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	38%
IMG OID	643715614
Product	argininosuccinate synthase
Protein accession	YP_002573122
Protein GI	222529240
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000123934
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTGA ACAAAGTTGT CTTGGCATAT TCAGGTGGAC TTGATACCTC TGTAATCATT 
CCCTGGCTTA AAGAAAACTT TGACTGTGAA GTAATTGCGG TGGTTGTTGA TGTTGGACAG 
GAAGATGACT TTGACGCCAT AAAAGAAAAA GCTTACAAGA CAGGTGCTTC AAAGGTTTAC 
ATTGAAGATG CAAAAGAAGA GTTTGTGAAT GAATATATAT TCCCCACTTT AAAAGCTGGA 
GCTATTTATG AGGGAAAATA TCTGCTTGGA ACATCAATGG CAAGACCTTT AATCGCTAAA 
AAACTGGTCA ATATTGCAAA AAAAGAAAAC GCTGATGCAA TAGCACATGG GGCAACTGGA 
AAAGGAAACG ATCAGGTAAG ATTTGAAGTG ACAATTAAAG CGCTTATGCC ACAAATAAAG 
ATAATAGCTC CATGGCGAAT TTGGAATTTA AAATCGCGCG AGGATGAGCT CAATTATCTT 
ACCCAAAAAG GAATTGATAT TCCTTTTAAA AAAGAAGAAA GTTACAGCAT GGACGGGAAC 
ATATGGCATC TTTCTCATGA AGGGCTTGAC TTAGAAGACC CATGGAACAT GCCTGACTTT 
GATAAGGTAC TAAAGATTAC AAAAAATCCC CTTAAACTTG CTGATTTACC AGAGACTGTG 
GAGATTGAAT TTGAAAAAGG AATACCTGTG AAAGTAAATG GTCAGCAAAT GGGTGGAGTT 
GAACTTTTGA AAACTTTGAA CAAAATAGGA TCAAATCATG GAATTGGTAT TGCGGACATA 
GTTGAAAACA GGCTTGTTGG AATGAAATCG CGCGGCGTGT ATGAAACCCC TGGTGGAACA 
ATTCTTTATT ATGCTCACAG GGAATTGGAA TATCTCTGCC TTGACAGAGC TACTTTACAC 
TTTAAAGACA TGGTTGCAAT TAGATTTGCT GAACTTGTTT ATGATGGGCT TTGGTTTTCA 
CCGTTAAGAG AAGCACTTTC AGCATTTGTC GACAAAACCC AAGAGGTTGT AAATGGCACA 
GTAAGGTTGG TACTATATAG AGGTAATATC TACTCTGCTG GTTCAAAATC ACCAAATTCG 
CTATATATCA AAGACCTTGC AACCTTTGAA GAAGACCAGA TGTACAATCA AAAGGATGCG 
GAAGGATTTA TAAACCTGTT TGGCTTGCCT TTGAAGGTAT TTGGAATGGT GAACAGAAAG 
GAGGATGAGT AA

Protein sequence

MKLNKVVLAY SGGLDTSVII PWLKENFDCE VIAVVVDVGQ EDDFDAIKEK AYKTGASKVY 
IEDAKEEFVN EYIFPTLKAG AIYEGKYLLG TSMARPLIAK KLVNIAKKEN ADAIAHGATG 
KGNDQVRFEV TIKALMPQIK IIAPWRIWNL KSREDELNYL TQKGIDIPFK KEESYSMDGN 
IWHLSHEGLD LEDPWNMPDF DKVLKITKNP LKLADLPETV EIEFEKGIPV KVNGQQMGGV 
ELLKTLNKIG SNHGIGIADI VENRLVGMKS RGVYETPGGT ILYYAHRELE YLCLDRATLH 
FKDMVAIRFA ELVYDGLWFS PLREALSAFV DKTQEVVNGT VRLVLYRGNI YSAGSKSPNS 
LYIKDLATFE EDQMYNQKDA EGFINLFGLP LKVFGMVNRK EDE