Gene Tery_0740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_0740
Symbol
ID	4243188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	1195939
End bp	1197330
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	35%
IMG OID	638106031
Product	argininosuccinate lyase
Protein accession	YP_720644
Protein GI	113474583
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.121768
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.29697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAAG ATAGACAAAC ATGGAGCCAA AGATTTGAAA AAGCACTGCA TCCTATGATA 
GCTAGATTTA ATGCTAGTAT TAGCTTTGAT ATTGAATTGA TTGAGCATGA TATAAATGGC 
TCAGTAGCTC ATACAAAAAT GTTAGCTAAA ACAGGTATTA TCTCCGCTGA AGAAGGAGAA 
AAATTATTGA CAGGTTTAGA ACAAATTCGT CAAGAATATA TAACCGGAAA TTTTCATATA 
GTTGAAGATG CTGAAGACGT TCACTTTGCT GTCGAAAAAA GACTGATAGA AATCACTGGA 
GATGTAGGCA AAAAACTACA TACAGCTAGG TCTAGAAATG ACCAAGTAGG AACTGATACT 
AGGCTTTATT TACGAGAAAA AATTGAACAA ATTCGGTTTT TATTGATCAA ATTTCAAAAA 
GTTATATTAG AATTAGCTGA GTCTAATATT GAAACTTTAA TCCCTGGTTA TACTCACTTA 
CAAAGAGCGC AACCTTTGAG TTTAGCTCAT CATCTTTTGG CTTATTTTCA TAAGGCGGAA 
AGAGATTGGG AAAGGCTAGG AGATGTTTAT CGTCGAGTTA ATATTTCTCC CCTTGGTTGT 
GGTGCTTTAG CTGGTACAAC TTTTCCTATT GATAGACACT ATACTGCTGA GTTATTAGGG 
TTTGAAAAAC CTTATGCTAA TAGTTTAGAT GGCGTAAGTG ACAGAGATTT TGCTATTGAA 
TTTCTTTGCG CAGCTAGTAT AATTATGGTG CATTTAAGTC GTTTGGCTGA AGAAATAATT 
GTGTGGTCAT CTGAAGAATT TAGGTTTGTA ACTTTAACTG ATGTTTGTTC CACAGGCTCG 
AGTATTATGC CTCAAAAAAA GAATCCTGAT GTACCAGAGT TAGTTAGGGG AAAAACAGGT 
CGAGTATTTG GTCATTTACA AAGTATGTTA GTGGTGATGA AGGGTCTGCC ACTAGCATAT 
AATAAAGACT TGCAAGAAGA TAAAGAAGGT TTGTTTGATA GTATTAAAAC TGTTAAAAGT 
TGTCTGGAGG CAATGACAAT TTTATTGGAG GAAGGTTTGG AATTTAACAG TGATCGCCTA 
ACAGAAGCAG TAGCAGAAGA TTTTTCTAAT GCTACAGATG TGGCAGATTA TTTAGCAGCT 
CGTGGTGTAC CATTTCGAGA AGCTTATAAT TTAGTAGGTA AGGTTGTGAA AACTTGTATT 
TCTGGTGGTA AATTACTGAA AGATTTAACT ATAAAAGAAT GGAAGGAATT ACATCCTGTT 
TTTGCAAGTG ACATTTATGA AGCGATAACC CCTTACCAAG TAGTGTCTGC ACGCAATAGC 
TATGGTGGAA CTGGTTTTAA ACAAGTAAAA ACAGAAATTG ACGTTGCCAA GCAAAAATTG 
GCAGAAAAAT AA

Protein sequence

MKQDRQTWSQ RFEKALHPMI ARFNASISFD IELIEHDING SVAHTKMLAK TGIISAEEGE 
KLLTGLEQIR QEYITGNFHI VEDAEDVHFA VEKRLIEITG DVGKKLHTAR SRNDQVGTDT 
RLYLREKIEQ IRFLLIKFQK VILELAESNI ETLIPGYTHL QRAQPLSLAH HLLAYFHKAE 
RDWERLGDVY RRVNISPLGC GALAGTTFPI DRHYTAELLG FEKPYANSLD GVSDRDFAIE 
FLCAASIIMV HLSRLAEEII VWSSEEFRFV TLTDVCSTGS SIMPQKKNPD VPELVRGKTG 
RVFGHLQSML VVMKGLPLAY NKDLQEDKEG LFDSIKTVKS CLEAMTILLE EGLEFNSDRL 
TEAVAEDFSN ATDVADYLAA RGVPFREAYN LVGKVVKTCI SGGKLLKDLT IKEWKELHPV 
FASDIYEAIT PYQVVSARNS YGGTGFKQVK TEIDVAKQKL AEK