Gene Tery_4203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4203
Symbol
ID	4245855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6481410
End bp	6482798
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	44%
IMG OID	638109100
Product	amidase
Protein accession	YP_723678
Protein GI	113477617
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0154] Asp-tRNAAsn/Glu-tRNAGln amidotransferase A subunit and related amidases
TIGRFAM ID	[TIGR02715] amidohydrolase, AtzE family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.742932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATCA AGCTCAACCA AACAGAAGCC GTATCAATGG CCACAGCCAT CAAAGCAGGG 
GAAACTACTG CTGAAATTTT AATAAACAAA TGTCTTGAAC AAATTTATGA GAATAACCGA 
ACTTTAAATT GCTTCACCGC TATCACAACA GAAAGCGCAC TTAATGCTGC CAAACAAATA 
GATAGAGACA TTTCTCAAGG CAAAAACCCC GGTCTCTTAG CAGGAATACC CTTCGCCGTC 
AAAAACCTCT ATGACATTGC AGGTTTAACC ACCCTTGCTG GAGCCAAAAT TAATGCCGAA 
AACCCACCTG CTACCCAAGA CGCAACCGCC GTTACCAAAC TAAAAAAAGC AGGTGCAATT 
CTGGTTGGTG CCCTCAATAT GGATGAATAT GCCTACGGTT TTGTTACAGA AAATAGTCAC 
TACGGTGCAA CACCTAATCC TCATGATCTC AGCCGTATCT CCGGGGGTTC CTCTGGTGCC 
TCTGCTGCTG CGGTTGCTGC GGGTTTAGTA CCCATTACCC TTGGTTCCGA TACGAACGGT 
TCCATCCGCG TACCTGCTTC TCTCTGTGGT GTTTTTGGGT TTAAGCCGAC TTATGGACGT 
TTATCACGAG CTGGCGTTTT TTTGTTTGCC AGTAGTTTAG ATAATGTTGG ACCCTTTGCT 
CGCTCTGTAC GAGATATTGC CACAGTTTAT GATATTTTAC AAGGGTCGGA TACAAGAGAT 
CCAGTTTGTA CTAAACGTTC TCCTGAAAGT TGTTTACCTC AACTCAAACA AGATATTAAA 
GATTTGCGCA TTGCTATTGC TGATGGTCAC TTTGCCCAAG GTGGTGAACC GGAGGTGTTT 
ACAGCAGTGG AACAAGTGGC AGAGGTATTG GGTGTCACTC AGCGGGTGAC AATACCTGAA 
GCAGATCGGG CGCGAGCTGC TGCTTATATT ATTACTGCGG CTGAAGGCGC AAATTTGCAT 
TTGGATAATT TGCGCATCCG TCCCCAAGAT TTCGATCCAG CAACTCGCGA TCGCTTTTTA 
GCAGGTGCTT TAATTCCGGC AGACTGGTAT ATCCAAGCTC AACGTTTCCG CCGTTGGTAT 
CAAAGTTCTG TTAAGGAAAT ATTTAATGAT GTAGATATTA TTCTAGCTCC AACTACCCCT 
TGTATTGCAC CGTTGTTAGG AGCTGAAAAA ATGACTATTA ATGGGGAGGA GGTGTTAGTA 
CGTCCGAATT TAGGTTTGTA TACGCAACCT TTGTCTTTTA TTGGGTTGCC AGTTTTGTCA 
GTTCCTATTC GACGTATTAA TGGTTTACCT TTGGGAGTAC AAATTATTGC TGCACCTTAT 
AATGAGGCTT TGGTATTGCA AGTAGCAGCA GTGTTGGAAT TTGAAGGGCT AACTACTGAA 
GTCAAATAG

Protein sequence

MTIKLNQTEA VSMATAIKAG ETTAEILINK CLEQIYENNR TLNCFTAITT ESALNAAKQI 
DRDISQGKNP GLLAGIPFAV KNLYDIAGLT TLAGAKINAE NPPATQDATA VTKLKKAGAI 
LVGALNMDEY AYGFVTENSH YGATPNPHDL SRISGGSSGA SAAAVAAGLV PITLGSDTNG 
SIRVPASLCG VFGFKPTYGR LSRAGVFLFA SSLDNVGPFA RSVRDIATVY DILQGSDTRD 
PVCTKRSPES CLPQLKQDIK DLRIAIADGH FAQGGEPEVF TAVEQVAEVL GVTQRVTIPE 
ADRARAAAYI ITAAEGANLH LDNLRIRPQD FDPATRDRFL AGALIPADWY IQAQRFRRWY 
QSSVKEIFND VDIILAPTTP CIAPLLGAEK MTINGEEVLV RPNLGLYTQP LSFIGLPVLS 
VPIRRINGLP LGVQIIAAPY NEALVLQVAA VLEFEGLTTE VK