Gene TM1040_3720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3720
Symbol
ID	4075427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	779668
End bp	780957
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	61%
IMG OID	638005240
Product	glutamate--ammonia ligase
Protein accession	YP_611949
Protein GI	99078691
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.698416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.273252
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACTC GCCTGCGCGC GTTATTCTGC GACCATCTCA GTATCATGCG CGGGAAATAC 
CTGCCGCATT CAAAGATCGG CGACGATGAA ACCCGGTTCT GCCGCTCTGT GTTTGGCACC 
CATTATGACC GCGACCTGCT GGACGCGCCG GGGTCGATGG TCAAACAGGG CCTACCAGAC 
ATGACGCTGC GCTGGCGTCA CGATGACATT CGCGACAGTT GGCACGCCTC GACCAAAATC 
GTCTTGGGCG ATCTTTATGA CGACGAGGGC GAGCTGCTGA CGCTTTGTCC CAGAGGGGCG 
TTGAAACGCG CCGTTGCGGA TTGGCAGGGA AAGGGGCTTT CTCCAAAAAT TGGTATCGAA 
CTTGAGGCTT TTGCCCTGCA GCCCGACGAA TACGGGCGGC TTGTCCCCTA TGATGCGCCC 
GGCGGAGTGG TCTACGGCAC CGGGCCGTTT GCAGATCCAT TACGGTTCAA TGACCGGATC 
TGGGCGATGG CGGATGAGAT GGGCTTCTCT CTCGACATGA TTACGGCGGA GTTCGACAGC 
CCTCAGTTTG AATATACGCT GACCTTTGAC GACGCTGTAA AGGCGGTGGA TGACATCGTG 
CTGTTTCGCT TGATGGCGCG TGAGATCGCG CTGGAGTACG GGATCGTTCT GACGTTCATG 
CCCAAGCCGG TCGCGCAGGC AGGGGGGTCA GGCATGCATG TGAACCTCTC GTTCACGGAT 
GAGGCGGGGG GAAATGCGCT TTCGTCGGGG CCTCGGGGCG GGCCGGATCA CATGAATGAT 
CTCGCGCGCG GCTGCCTTGC CGGGTTTCTG CATCATCACA AGGGCTTGGC CGGTCTGATC 
GCGCCCACCG CCAACAGCTA CATGCGTCTG CAACCGGGGA GTCTGTCGGG CTTTTGGCAG 
AACTGGGGCG GCGATCATCG CAATGTCACC ACTCGGATCA GCTCCGAAGG CGGGGCGAAG 
GCGCGGCTTG AACACCGAAT GGCGGATGCC TCCTCCAATC CCTATACCAC GGTGGCGGCG 
CTCTTGCAGG CGGCGCGCCT TGGCGTGGAG CGCGGCTATG CGCTGGGACC GATGGAAACC 
GGCGATGGGT TTGACCGCAC GGACACGCGC GAAAGCACCG CAATGACGCT CAAGGGCGCG 
GTCGCAGATC TGGAAAAGGA TACCTCCCTT GCGGAGGCGG TGGGGCCGGA TCTGGTCGCC 
AATCATGTCT ACATGAAGCA GAAAGAGGTC CGCAAAACCC GCGACCTCGA AGGCGATGCG 
CTGCGGGACT TCTACGTGCA TTTTGTCTGA

Protein sequence

MKTRLRALFC DHLSIMRGKY LPHSKIGDDE TRFCRSVFGT HYDRDLLDAP GSMVKQGLPD 
MTLRWRHDDI RDSWHASTKI VLGDLYDDEG ELLTLCPRGA LKRAVADWQG KGLSPKIGIE 
LEAFALQPDE YGRLVPYDAP GGVVYGTGPF ADPLRFNDRI WAMADEMGFS LDMITAEFDS 
PQFEYTLTFD DAVKAVDDIV LFRLMAREIA LEYGIVLTFM PKPVAQAGGS GMHVNLSFTD 
EAGGNALSSG PRGGPDHMND LARGCLAGFL HHHKGLAGLI APTANSYMRL QPGSLSGFWQ 
NWGGDHRNVT TRISSEGGAK ARLEHRMADA SSNPYTTVAA LLQAARLGVE RGYALGPMET 
GDGFDRTDTR ESTAMTLKGA VADLEKDTSL AEAVGPDLVA NHVYMKQKEV RKTRDLEGDA 
LRDFYVHFV